关闭广告

中科大团队实现AI图表数学逻辑理解

科技行者4180人阅读


这项由中国科学技术大学多媒体计算与通信实验室的乐卓等研究者领导的突破性研究,联合北京航空航天大学、上海交通大学、上海人工智能实验室、Hugging Face、新加坡国立大学、字节跳动和香港大学等多个机构,于2025年10月发表在计算机视觉顶级会议上。这项研究首次系统性地解决了AI在生成和编辑结构化图像时"看起来很美实际不准"的核心问题,让人工智能真正具备了理解图表、公式、图形背后数学逻辑的能力。

想象一下,你让AI画一个饼图显示公司各部门的销售占比,AI可能会画出一个看起来很专业的彩色饼图,但仔细一看,所有扇形加起来的角度根本不是360度,或者标注的百分比数字完全对不上扇形的实际大小。这就像是一个只会模仿画家笔触却不懂数学的学生,虽然画得有模有样,但内容完全经不起推敲。

现在的AI图像生成技术确实已经能创造出令人惊叹的自然图像,比如逼真的风景照片或者艺术作品,但当涉及到需要精确计算和逻辑推理的结构化图像时,就像是让一个从未学过数学的人去画函数图像一样困难。这些结构化图像包括数学公式、统计图表、几何图形、科学示意图等,它们不仅要求视觉上的美观,更重要的是内容的准确性和逻辑的严密性。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

冬天从60分穿到80分,只需要这个实用单品

黎贝卡的异想世界 浏览 3938

男子爬衡山丢80.88克金牌 失主:做好找不回的打算了

极目新闻 浏览 7760

阿里小贷正式完成注销,退出历史舞台!

中国基金报 浏览 4470

闫学晶和儿子接连道歉 儿子连说两遍"娘的错儿子担"

北京日报 浏览 13698

西方媒体称中国对伊朗"见死不救" 官方回应来了

环球网资讯 浏览 117846

鞋子专场||穿了五年十年,掏心窝子说,最常穿的还是这一双!

黎贝卡的异想世界 浏览 3651

推广中奖名单-更新至2025年9月8日推广

黎贝卡的异想世界 浏览 6533

ESPN:因内马尔的身体状况和高额薪资,桑托斯不急于和他续约

懂球帝 浏览 4515

弗里克:首先要不失球;费兰明天能上

懂球帝 浏览 3195

鸿蒙智行顶流!百万级新旗舰,尊界MPV最新谍照曝光,实力剑指丰田埃尔法

隔壁说车老王 浏览 2837

"民营船王"33亿元入主杉杉 继母长子内斗2年双双出局

都市快报橙柿互动 浏览 4490

马斯克评英伟达纯视觉自动驾驶系统Alpamayo

不看车bukanche 浏览 3462

将生产两款纯电SUV 丰田最新消息曝光

乐选爱车 浏览 5118

2025 FT年度人物:黄仁勋

新智元 浏览 3732

本赛季前5轮三支英超升班马共拿19分,比上赛季三队快一倍

直播吧 浏览 5159

聚辰半导体冲刺港股:9个月营收9.3亿利润3.1亿陈作涛控制24%股权

雷递 浏览 3346

Jane Street、Citadel Securities三季度业绩强劲,全年有望创纪录

华尔街见闻官方 浏览 3769

时隔25年,上一个时代的“英伟达”终于涨回来了

华尔街见闻官方 浏览 3655

以色列继续袭击约旦河西岸 哈马斯谴责

每日经济新闻 浏览 4130

杨立昆、李飞飞等提出空间超感知范式,用预测未来代替暴力记忆

DeepTech深科技 浏览 4013

业绩承压借款激增 林平发展“带伤”闯关IPO

北京商报 浏览 3877
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1