工联院大模型测评:文心一言在工业领域表现超过GPT3.5
IT科技 2023-06-29 创始人
【资料图】
北京商报讯(记者 魏蔚)6月28日,北京商报记者获悉,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测结果显示,百度文心一言表现超过GPT3.5,综合评价指数在国内排名第一。工联院本次评测选取了工业领域典型的八大行业。百度文心一言在电子设备、装备、钢铁、采矿、电力、石化、建材七个行业均获国内第一。
本次工业知识问答测试主要分为客观题与主观题两大类,总计超过1100个问题。主观题主要考察四大维度:基础能力、语句能力、概括能力和逻辑能力。评测结果显示,GPT4表现最佳。国内头部大模型表现亮眼,整体与GPT3.5相当。其中百度文心一言表现超过GPT3.5,在国内大模型中排名第一。在客观题环节,评测结果显示,GPT4与文心一言表现好于其他大模型。但评测结果也同时指出,大模型普遍准确率有较大的提升空间。主观题方面,国内大模型的基础能力、语句能力与GPT4接近,概括能力、逻辑能力与GPT4有一定差距。在大模型的自我认知能力和污染问题分析能力上,GPT4相较于其他大模型表现出更好的能力。
(责任编辑:周文凯 ) The End
相关阅读
- 【天天聚看点】NASA发布新一代登月太空服 2025重返月球就穿它
- 英特尔发布全新SoC解决方案,大幅降低成本,加速电动汽车创新
- 贾跃亭回应FF 91第二批交付延迟 正全力推进FF中国落地项目
- 艾为电子推出车规电平转换AW39124-Q1和AW39214-Q1,助力汽车创新发展,实现全球“碳中和”
- 意法半导体新车规单片同步降压转换器面向轻负载、低噪声和电隔离型电源应用
- 戴尔发布2024财年第二财季财报:营收229亿美元 运营利润同比下降8%
- 热点丨爱奇艺CEO龚宇:未来2年专注原创电影 盗版非主要问题
- 马杰卸任李开复大模型公司职务 由李先刚接任并持股
- 哪里出售已经实名认证手机卡、在哪买卖实名制激活手机卡
- 【世界热闻】睡觉时身体为什么会抖一下?或许是大脑的求救信号