主题：【图像处理求助】后续 -- 一双草鞋

【图像处理求助】后续

不好意思占用一个新主题的资源，因为无法回复那个【图像处理求助】出国的就别管了，先救救国内群众的急老帖了。

问题可以点击上面链接查看，我这里说说解决办法。

1. 按照 @假设的建议，以FFmpeg软件提取关键帧，这个对于正确标记的或许有用，但是恰好我得到的这些视频大多标记并不对，常常搞错。

2. 基于 @小科的建议，略有发展，即以每一帧前后若干帧（根据数据测试，我的这些视频前后各取2帧是个好的折中）作比较，若如果差别很小，则判断这帧为一个稳定的帧。在稳定的帧这个子集里，按照主贴办法去除重复，得到需要的单一帧。

3. 基于chatgpt的建议的算法。读取全部数据后，用kmeans做聚类分析。这需要自己给于一个聚类个数的假设。先取一个比较大的值，然后聚类完成后，再去看他们之间的距离，足够近就合并。但是后者效果不好。即我能得到几乎全部的希望得到的图片，但是会有部分重复，或不需要的转换帧。

另外我向chatgpt抱怨电脑性能不够，它建议我subsample还有把彩色改黑白，确实效果几乎不变的情况下，大大提升速度。

如果是能挣钱的话，我估计会在kmeans之前，加一个图像分割的步骤，比简单的像素做输入应该更好。当然整个任务弄个多层的神经网络更好，只是我缺乏足够精力去学习、细化这个东西了。

最后的处理是：先用主帖办法，失败后退到方法2，再失败退到方法3。这三个办法依次更消耗资源，需要手动参数越多，但是也越普适。

感谢前面提到的两位网友和 @盲人泪， @小科， @hamigua 的参与和关心。

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友