关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者4369人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

定位顶级奢华MPV 奔驰VLE测试谍照曝光

车质网 浏览 3601

闭店风波后,实探“上上谦”仅存门店:薛之谦曾入股,周末用餐高峰仍需排队

时代周报 浏览 4139

普通人冬天就该这么穿,衣服不昂贵、搭配不老气,简单又日常

静儿时尚达人 浏览 3772

外观微调配置全面 小鹏P7+新老款车型对比

车质网 浏览 3253

接过430Phev的棒,上汽大众帕萨特ePro广州车展实拍来了!

凡兮说 浏览 4057

史上头次只有6人拍总决赛合照,ATP骚操作引球迷众怒:德约呢?

网球之家 浏览 4260

介绍一个如果你用了,你就看不到这篇文章的产品

时尚COSMO 浏览 3678

林俊杰女友报警反击谣言,获男友极力维护,果然是奔着结婚去的

萌神木木 浏览 3436

俄外长:向乌提供“战斧”将让俄美关系出现最危险局面

上观新闻 浏览 4337

给《树影迷宫》演技最好的7位演员排座次:刘琳第3,第1无法超越

娱乐圈笔娱君 浏览 4120

黄仁勋与李飞飞,让AI不止于“动嘴”

首席商业评论 浏览 3465

《向往8》暴露明星真实性格!张子枫老实,何炅诙谐,黄磊最强势

娱乐圈笔娱君 浏览 4462

新势力做了这么久豪车 为什么只有尊界卖爆了?

差评XPIN 浏览 3583

中国色特别策划 | 故宫技艺与古意新生

时尚COSMO 浏览 3410

原来最适合亚洲人的单品之一,是它

黎贝卡的异想世界 浏览 3842

红毯走成这样,也太抽象了……

严肃八卦 浏览 3525

搭VLA大模型 全新蓝山智能进阶版将上市

网易汽车 浏览 3627

衣服穿对不穿贵,这些才是最适合普通人的穿搭,优雅又简约

静儿时尚达人 浏览 4026

由内而外大变化 第四代CS55PLUS上市限时优惠7.89万起

网易汽车 浏览 5117

奶茶、刮刮乐、GPS:整顿坟场的 00后,开始给太奶上难度

她刊 浏览 1792

拼多多1000亿豪赌新拼姆,跨境电商变天?

Tech星球 浏览 520
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1