关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者2702人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

也算是开眼了!英国新能源车起不来,媒体将责任“划”给了小偷

小李车评李建红 浏览 2665

伊朗最高领袖哈梅内伊遇害 中方回应

财联社 浏览 844

谷歌AI实现类人判断解决系统偏见问题

科技行者 浏览 2543

汽车豪门法拉利掀母子撕逼战 继承人遭母亲"背刺"

澎湃新闻 浏览 7040

ChatGPT跟进阿福,AI健康按下快进键

海克财经 浏览 1655

小米汽车事故后甩锅,真诚真的难吗?

宏哥谈商道 浏览 2772

吉利汽车集团10月销量307133辆 同比增长35%

网易汽车 浏览 2115

停办吧!《奔跑吧》首播差评一片,请一大堆明星没一个能拿得出手

娱乐圈笔娱君 浏览 2252

别问了,今年朋友圈都在打网球

时尚COSMO 浏览 2125

美方在公海海域扣押悬挂俄罗斯国旗的油轮 外交部回应

澎湃新闻 浏览 12484

周星驰新片被传空降春节档,制作成本3.8亿,票房能否冲击40亿

娱乐圈笔娱君 浏览 1424

华为星闪起猛了!蓝牙技术全面应战,还针对中国市场出招

雷科技 浏览 2478

慢镜头:莫塔不会回归尤文,但他的合同会影响尤文选帅

懂球帝 浏览 2648

灵鹊150无人机成功首飞

新华社 浏览 1652

寒武纪业绩“惊雷”:环比数据全线下滑,却意外点燃AI行情!

君临财富 浏览 2555

冬季不臃肿穿搭指南来了,奔五奔六照着穿,拿捏温暖与高级感

静儿时尚达人 浏览 1622

东体:申花充分利用体能优势,亚冠失利对蓉城士气的打击或许更大

直播吧 浏览 3487

梅州众将:不管未来怎样都要打好最后一场,拼出个保级机会

懂球帝 浏览 2390

从负债几百万,到霸榜粮油,抖音直播间隐藏着农业产业带的崛起

锦缎研究院 浏览 3304

何晴告别式现场,前夫许亚军疑似现身双眼泛红,大量群众自发悼念

萌神木木 浏览 1918

中国买家为希腊黄金签证花25万欧买房 如今2万欧卖出

红星新闻 浏览 7104
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1