主题:【图像处理求助】后续 -- 一双草鞋
共:💬5 🌺39
不好意思占用一个新主题的资源,因为无法回复那个【图像处理求助】出国的就别管了,先救救国内群众的急老帖了。
问题可以点击上面链接查看,我这里说说解决办法。
1. 按照 @假设 的建议,以FFmpeg软件提取关键帧,这个对于正确标记的或许有用,但是恰好我得到的这些视频大多标记并不对,常常搞错。
2. 基于 @小科 的建议,略有发展,即以每一帧前后若干帧(根据数据测试,我的这些视频前后各取2帧是个好的折中)作比较,若如果差别很小,则判断这帧为一个稳定的帧。在稳定的帧这个子集里,按照主贴办法去除重复,得到需要的单一帧。
3. 基于chatgpt的建议的算法。读取全部数据后,用kmeans做聚类分析。这需要自己给于一个聚类个数的假设。先取一个比较大的值,然后聚类完成后,再去看他们之间的距离,足够近就合并。但是后者效果不好。即我能得到几乎全部的希望得到的图片,但是会有部分重复,或不需要的转换帧。
另外我向chatgpt抱怨电脑性能不够,它建议我subsample还有把彩色改黑白,确实效果几乎不变的情况下,大大提升速度。
如果是能挣钱的话,我估计会在kmeans之前,加一个图像分割的步骤,比简单的像素做输入应该更好。当然整个任务弄个多层的神经网络更好,只是我缺乏足够精力去学习、细化这个东西了。
最后的处理是:先用主帖办法,失败后退到方法2,再失败退到方法3。这三个办法依次更消耗资源,需要手动参数越多,但是也越普适。
感谢前面提到的两位网友和 @盲人泪 , @小科 , @hamigua 的参与和关心。
- 相关回复 上下关系5
🙂【图像处理求助】后续
🙂刚才试了下FFMPEG提取场景转换帧 7 假设 字308 2023-10-27 04:56:37