商量SenseChat 2.0发布:语言大模型研究取得重要突破_观天下
来源:中关村在线 发布时间:2023-06-26 06:19:12


(相关资料图)

近日,商汤科技发布了自研中文语言大模型“商量SenseChat 2.0”的测试成绩,数据显示在MMLU、AGIEval、C-Eval三个权威大语言模型评测基准中均超越了OpenAI的ChatGPT。在某些方面,商量SenseChat 2.0的表现已接近GPT4的水平,意味着我国语言大模型研究取得了重要突破。 这三个测试分别为:MMLU是美国加州大学伯克利分校等高校构建的多任务考试评测集;AGIEval是微软研究院推出的学科考试评测集,包括中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等;C-Eval是由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集。在这三个测试中,商量SenseChat 2.0的表现均超越了ChatGPT以及国内外多款大模型,仅次于GPT-4。 在MMLU测试中,商量SenseChat 2.0的综合得分为68.6,位居第二,仅次于GPT-4(86.4分);在AGIEval测试中,商量SenseChat 2.0以49.91分紧追GPT-4(56.4分);在C-Eval测试中,商量SenseChat 2.0获得66.1分,仅次于GPT-4(68.7分)。 目前,已有近千家企业客户通过申请使用商量SenseChat 2.0,体验其长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力。商汤科技表示,将持续对“商量SenseChat 2.0”进行快速迭代和提升,实现知识的实时更新。

标签:

猜你喜欢

商量SenseChat 2.0发布:语言大模型研究取得重要

近日,商汤科技发布了自研中文语言大模型“商量SenseChat2 0”的测试成更多

2023-06-26 06:19:12

每日时讯!小米官方再辟谣:这些活动都是假的

近日,@小米品牌安全(小米集团法务部维权组官微)在微博上辟谣称,以X更多

2023-06-26 06:35:35

微软:Xbox Series X是半代升级版 没有“半代

本站于6月21日消息,微软早前推出了本世代首款“升级版”游戏主机,升更多

2023-06-26 06:29:17

美国人选出2023十佳电动汽车:没有特斯拉也没有比

美国汽车专业网站Autotrader近日发布了一份新榜单,列举了2023年十款最更多

2023-06-26 06:13:06

8年NFC技术发展路线图公布:将扩大使用范围 焦点

近日,NFC论坛公布了其在未来8年的技术发展路线图。据悉,NFC技术在未更多

2023-06-26 06:16:44

微软不升级Xbox S 主机,索尼正在研发新款主机-

微软近日确认,暂无计划为现有游戏机推出中期升级版,因为对他们来说,更多

2023-06-26 06:32:14

约2891元起!一加Nord3手机价格曝光:可选16GB内存

根据推特用户AbhishekYadav的爆料,一加即将发布的Nord3手机在印度的售更多

2023-06-26 06:30:34

苹果负优化:iOS 16.5.1更新完降续航

最近,苹果发布了iOS17Beta2和iOS16 5 1更新,针对测试版和正式版用户更多

2023-06-26 06:18:36

天天资讯:微软DX12 Agility SDK更新,加快GPU

软件开发人员现在将能够利用工作图,这个功能将实现异步着色器的利用。更多

2023-06-26 06:34:45

moto razr 40发布:3999元起 6.9英寸折叠屏

近日,摩托罗拉发布了其全新motorazr40系列折叠屏旗舰手机。该系列包括更多

2023-06-26 06:33:10