大模型时代进入尾声：场景式模型接棒

2023-04-21 04:38:20 钛媒体APP

图片来源@视觉中国

ChatGPT像里科技行业里的鲇鱼，搅动一池春水。自从它出现之后，中国科技企业扎堆发布AI大模型。

(资料图片仅供参考)

有人嘲讽，ChatGPT在中国即将“亩产过万”；也有人调侃，下个阶段该是“全民大模型，ChatGPT进万家”了吧；还有人直言，ChatGPT是十月怀胎，中国大模型一个月成型。

中国大模型为何能飞速成型？究竟是养在深闺人未识，还是跟风造概念？阿里云CTO周靖人说过，动辄超千亿参数的大模型研发，不是单一的算法问题，也不是靠简单堆积GPU就能实现的。大模型是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程，需要AI-云计算的全栈技术能力。

在当下增长乏力的科技互联网产业生态中，互联网企业把大模型当做救命草。不过，尽管市场火热，但潮退后才能见识真实力。‍

中国科技圈，大模型的大跃进如火如荼，但在本月初， OpenAI 的 CEO 在演讲中警告称：我们已经处在大模型时代的尾声，并表示如今的生成式AI （AIGC ）发展中，将数据模型进一步做大，塞进更多数据的方式，已经是目前人工智能发展中最后一项重大进展，并且还声称目前还不清楚未来的发展方向如何。

可以预言的是，当下大模型技术对于 AIGC 的发展至关重要，但从长远来讲，AI 的发展绝不会永远依赖大模型的参数提升和算力的堆砌。未来，针对更具体的应用场景，开发更小更精准、针对应用场景的模型才是发展的方向。

本文将盘点目前市场上呼声较高的大模型，中国大模型究竟是昙花一现，还是千锤百炼不断精进，让我们持续关注。‍‍‍‍‍‍‍‍‍‍

OpenAI

2021年11月，OpenAI推出了GPT3.0。它是运用1759亿个参数所实现的预训练语言模型。去年年底ChatGPT问世，该系统发布后五天内就吸引了超过100万用户。

ChatGPT是人工智能技术驱动的自然语言处理工具，其使用的人类反馈的强化学习技术，可以更容易推断出用户的意图，产生更自然和更合理的回答，像人类一样来聊天交流，完成撰写视频脚本、文案、代码、论文等任务。

今年2月OpenAl投资人微软宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing（必应）和Edge浏览器，到今年3月15日，OpenAI推出GPT-4文本生成AI系统，但仅向Plus付费订阅用户及企业和开发者开放。

OpenAI公布的训练GPT模型由于训练过程复杂，数据不透明，加上长期的技术迭代等，其在算法层和硬件层积累起巨大优势，外界想要复制ChatGPT并不容易，ChatGPT目前在大模型领域的霸主地位无人能够撼动，OpenAI市场估值已经达到290亿美元，成为世界上估值最高的初创公司。

现在的ChatGPT面对的不只是商业化和监管的压力，由马斯克、图灵奖得主Bengio等千人联名的“暂停高级AI研发”的公开信，目前签名数量已有9000多人，此外，它也受到越来越多的国家的抵制，在其出现的两个月后，意大利就宣布禁止使用ChatGPT，原因是认为ChatGPT平台不安全并且会非法收集大量用户信息。

特点：可以直接面向C端用户群体。

参数量大：ChatGPT-3模型使用了1750亿个参数， ChatGPT-4的参数量更大，

迭代快：OpenAI在原本官网产品下拉菜单中的ChatGPT已换成了GPT-4。

百度“文心一言”大模型

作为国内人工智能（AI）领域的旗手，今年3月，百度就推出直接对标ChatGPT的文心一言。

文心一言也拥有文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成的能力。百度文心一言的发布会后一小时内，排队申请文心一言企业版 API 调用服务测试的企业用户超 3 万家，申请产品测试网页多次被挤爆。

根据后期大量试用的反馈，文心一言也暴露出通过模式和规则来生成文本等问题，对比之下，业界出现了“百度抢占大模型市场的心态操之过急”的看法，也让大家看到了国内外自然语言处理大模型方面的差距。

事实上百度在大模型领域沉淀已久，百度早在2019年就推出了文心大模型ERNIE 1.0，而目前，ERNIE 3.0每天接受数十亿用户的搜索请求。文心一言会基于飞桨深度学习平台和文心知识增强大模型，持续从海量数据和大规模知识中融合学习，具有知识增强、检索增强和对话增强的技术特色。

已有650家企业伙伴加入文心一言生态，包括小度和自动驾驶Apollo等产品，以及爱奇艺等公司也已经接入百度的文心一言模型。

特点：拥有三级大模型技术体系

形成了“基础-任务-行业”三级大模型技术体系，拥有NLP、计算机视觉（CV）、跨模态等基础大模型，以及对话、跨语言、搜索等任务大模型，还有生物计算领域大模型、各行业大模型及支撑大模型应用的工具平台。

阿里通义大模型

4月11日，阿里云智能首席技术官周靖人在阿里云峰会上正式官宣阿里巴巴“通义千问”。

打开通义千问，是一个聊天对话框，与竞品相似，通义千问在作为“问答机器人”基础上还新增了图片生成应用功能，通过拍照上传一张功能草图，便可以自动生成低代码业务应用。

实际上，早在2022年9月阿里巴巴达摩院就发布了“通义”大模型，打造了国内首个AI统一底座，并且通义M6使用的参数规模超过了ChatGPT，是全球参数规模最大的AI模型。

去年11月阿里还正式提出“Model as a Service”理念，牵头搭建了国内规模最大的AI模型服务社区“魔塔”，公布的数据显示，魔塔社区目前已有超100万活跃用户，模型累计下载次数超1600万，模型总数达800个，与十几个顶尖人工智能机构合作。

接下来，阿里所有App，包括天猫、淘宝、钉钉等未来都会接入通义千问，进行全面改造。

通义大模型更偏向为B端服务，周靖人在峰会上强调，未来每一个企业在阿里云上既可以调用“通义千问”的全部能力，也可以结合企业自己的行业知识和应用场景，训练自己的企业大模型。在2022年阿里就将AI应用于电力调度，联合电网研发出高精度电网负荷预测模型，现已在山东德州落地。

特点：服务B端、瞄准企业客户

商汤“日日新大模型”

在4月10日的商汤技术交流日活动上，商汤“日日新SenseNova”大模型体系正式问世，作为中文大模型，其包含自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力，商汤还公布了基于该体系的AI内容生成式平台——包括秒画、如影、琼宇、格物等。

目前商汤在AI领域的投入规模已经超过百亿，商汤已打造CV（计算机视觉）、NLP（自然语言处理）、AIGC（人工智能内容生成）多个AI大模型，历时五年，商汤一直秉持“模型重在能力而非规模”的看法，在2019年于上海临港建设的商汤人工智能计算中心，共有5000Ｐ算力，大装置拥有2.7万块GPU芯片卡，实现自供算力以训练大模型。

商汤也发布了自研类ChatGPT产品“商量”，作为千亿级参数的自然语言处理模型，其能够提供以下功能：编程助手，帮助开发者编写和调试代码；健康咨询助手，为用户提供个性化的医疗建议；PDF文件阅读助手，能轻松从复杂文档中提取和概括信息等能力，商汤科技联合创始人王晓刚则表示“商量”大模型未来主要面向ToB端。

此外商汤的大模型研发体系在多种行业场景中落地，比如为政企客户提供包括视觉感知通用任务与标注服务等多种灵活的API接口和服务，客户根据实际应用需求调用大模型的各种AI技术能力。“日日新SenseNova”应用在智能驾驶领域，实现了可识别3000类物体的BEV环视通用感知算法的实车量产，也构建了感知决策一体化的自动驾驶多模态模型，能够给环境、行为、动机解码能力带来突破。

特点：场景式大模型，关注具体的使用场景‍‍‍‍‍

谷歌

2023年2月，Google发布了Bard大模型，这是一款用于对抗ChatGPT、在一个大型语言模型（LLM）基础上推出的智能聊天机器人，Bard作为谷歌对话应用语言模型，可以说是LLaMDA的一个轻量和优化版本。3月21日，谷歌向公众开放了Bard的访问权限，但目前仅支持年满18岁的美英用户注册试用，且只支持英文提问。

Bard也为用户提供了一个单独的聊天界面，从AI功能上来看，Bard跟其他AI模型大同小异，用户可以在文本框中进行提问和搜索，比如让Bard帮你写一篇文章、列一个计划、解决一个题目得出结果等。

然而在谷歌短短的几秒展示里，Bard就出现了大问题：被问到“我可以告诉我 9 岁的孩子关于詹姆斯·韦伯太空望远镜（简称JWST）的哪些新发现？”时， Bard的回答里面有一个巨大的错误：回答里提到“ JWST 拍摄到了太阳系外行星的第一张照片”，事实上，第一张系外行星照片应该是2004年由欧洲南方天文台的Very Large Telescope拍摄的。

由于有了上线后曾出现的混乱和批评的前车之鉴，现在谷歌Bard整个界面都透露出谷歌满满的求生欲。在你开始使用Bard之前，会有一个免责声明，明确提醒你Bard目前还只处于实验阶段。无论是在提问的文本框下面还是答案生成框下方，时刻都写着一行小字，提醒用户“Bard可能生成不准确或者略带攻击性的信息，但并不代表谷歌官方观点”。

特点：聊天大模型、准确性不佳

360‍‍‍‍‍

3月29日，在“2023数字安全与发展高峰论坛”上，周鸿祎现场演示了360自研的人工智能语言模型在360浏览器上的应用，并宣布了360的人工智能发展战略。

360于4月9日公告，基于360GPT大模型开发的人类智能产品矩阵“360 智能脑”将落地搜索场景，面向企业用户开放内测。据了解，企业用户在PC端360 搜索首页申请并获得测试资格后，可通过企业安全云体验使用。未来，360 智脑将与浏览器、数字助理、苏打办公、智能营销等场景应用深度结合，全面提升用户工作效率。

特点：面向B端

昆仑万维

昆仑万维公众号在4月10日宣布：由昆仑万维和奇点智源合作自研的，中国第一个真正实现智能涌现的国产大语言模型——“天工3.5”发布在即，并于4月17日启动邀请测试。

昆仑万维甚至宣称“天工”大模型已经非常接近OpenAI ChatGPT的智能水平。ChatGPT是基于GPT3.5大模型，所以把这个版本命名为“天工3.5”。昆仑万维研发团队2020年从一亿级模型做起，上升至十亿级模型，再到百亿级模型，在三年后将研究成果放入大模型之战，选择开源的方式入局。

特点：偏向C端的语言大模型‍

大模型时代进入尾声：场景式模型接棒

2023-04-21 04:38:20 钛媒体APP

OpenAI

百度“文心一言”大模型

阿里通义大模型

商汤“日日新大模型”

Meta

谷歌

360‍‍‍‍‍

昆仑万维

相关推荐

大模型时代进入尾声：场景式模型接棒

海通恒信：以ESG理念促进高质量发展 经营业绩稳健增长-百事通

长宁新增一处“乐邻惠老”新空间！ 焦点精选

量少价高购买难，堪称“续命粮”的特医食品何时能亲民？

护脾胃助长高，谷雨节气中医专家教养生

网络安全知识竞赛、安全知识涂色卡创作……苏州相城筑牢青少年网络安全“防火墙”

全球聚焦：前海开源睿远稳健增利混合增聘基金经理林巧亮

内蒙古鄂尔多斯警方集群打零抓获涉毒人员105名

欧盟碳边境调节机制影响越南钢铁和铝出口

阿里巴巴逐步开放“通义万相”；腾讯发布超强算力集群 | 每日资讯 每日快播

老年人小便失禁怎么办_老年人尿失禁治疗方法是什么

《暗黑破坏神4》或于发布前再次开测！官方推特回应暗示

深圳二手房指导价成过去式？银行工作人员：确有此事，但尚无正式文件|世界滚动

4月20日山东宏信苯酐价格暂稳

时髦的紧身裙形象，展现性感魅力，韵味十足！ 世界新消息

天天快看：iPhone 14频繁重启 遭大规模用户投诉

航天电器(002025):22年期间费用较高影响业绩,看好23年经营质量改善-年报点评 天天热点

WTO总干事警示：无法承受没有任何可交付成果的MC13

天天快播：牵牛花的象征意义是什么(牵牛花象征着什么意义)

关注：期货交易爆仓实录+点评，仔细阅读抵做10年交易！ 文段二

天天快看：沉寂与静寂的意思（静寂的意思）

《战争传说》反击剑怎么配置？反击剑配置介绍

28股遭大宗低价甩货 最低7.2折

即时看！陕西省耀州区发布沙尘暴黄色预警

湖北荆门发布臭氧污染临时管控的通知

两名俄罗斯宇航员完成太空行走任务-每日热讯

【世界热闻】华特达因：公司研发费率保持相对稳定，研发费用会随着研发项目进展情况按计划支出

南昌周大福黄金价格今天多少一克（2023年4月20日）|当前观点

宣汉县南坝镇天台中心校开展初中文科组课堂教学大比武活动-全球视点

快看点丨杭州高新区（滨江）：推动创新驱动高质量发展全面提质提速

易极：4-20原油在回调中寻找支撑位

选择光纤电缆的5个理由-全球今日讯

当前视讯！京东方Ａ：OLED是未来公司投资的方向之一，公司非常重视技术方向的选择

硬盘备份软件 SnapShot中文版 v1.50.0.1161

百家云2023财年上半年净利润480万美元同比扭亏，宣布推出AIGC解决方案

4月20日碳基材料板块跌幅达2%

今日快看!广交会助力“专精特新” 企业走得更远

速递！风景_记叙文600字 天津高考满分作文600字：说说我们90

新资讯：展千场消防宣传培训，组百人消防宣讲团

博士考试科目哪里看_博士考试科目

中国联通国际可研勘察设计两标包结果出炉：两家入围，平均折扣46%

美联储官员讲话仍偏鹰派 国际黄金高位滞涨|天天时快讯

世界观焦点：爱媛果冻橙介绍?

哈姆：我们拿下了G1但很不幸没拿下G2 这次客场之旅还不错 天天短讯

百余个品种轮流绽放 高山花卉也能在盆地盛开

环球今头条！吉林：引导和督促金融机构对接房地产开发融资需求

一斤小龙虾够一个人吃吗-世界热推荐

工行节节高是理财吗_工行节节高2号是骗局 焦点快看

没钱了?国足最新计划被曝光,高洪波做出争议决定，扬科维奇很无奈

水浒传好句摘抄大全200字（水浒传好句摘抄大全）

精彩推送

当前热文：我国挂牌国家考古遗址公园达55处，近五年累计接待游客1.46亿人次

热议：６旬老人手写感谢信，背后的故事令人动容……

离婚时签的离婚协议能修改吗？

焦点日报：产值4000万元！毕节金沙制茶机械生产忙

通讯！注意防范！青岛发布大雾橙色预警 局部能见度小于50米

美联储官员鹰派言论点燃加息预期 美股三大指数涨跌不一|最新消息

宜信惠普是做什么的 宜信惠普

深水规院：2022年度净利润亏损近3000万元

环球热讯:化工行业深度报告：AI赋能，助力化工行业转型升级——AI赋能化工之二

全球快报:世界冠军为“东极卫士”代言 ——佳木斯边境管理支队聘请武大靖担任边防政策法规宣传公益形象大使

曲剧《鲁镇》将在国家大剧院上演，融汇鲁迅多部名作 环球即时

雷军下手太狠！小米13 Ultra居然5999起定价，连夜说服高管奏效了 环球报道

每日聚焦：这场博览会上，市民可将文物“带回家”

成都一小区凌晨发生火灾，物业：四人轻伤

【环球速看料】独游制作人都在怎样用AI辅助开发游戏？

天天微资讯！国家移民管理局：一季度6506.5万人次出入境

最新：上汽名爵带来双门两座敞篷跑车Cyberster 将于7月份正式发布

“博士直通车”直达科研一线|全球微头条

海通恒信：以ESG理念促进高质量发展经营业绩稳健增长-百事通

长宁新增一处“乐邻惠老”新空间！焦点精选

阿里巴巴逐步开放“通义万相”；腾讯发布超强算力集群 | 每日资讯每日快播

时髦的紧身裙形象，展现性感魅力，韵味十足！世界新消息

天天快看：iPhone 14频繁重启遭大规模用户投诉

航天电器(002025):22年期间费用较高影响业绩,看好23年经营质量改善-年报点评天天热点

关注：期货交易爆仓实录+点评，仔细阅读抵做10年交易！文段二

28股遭大宗低价甩货最低7.2折

速递！风景_记叙文600字天津高考满分作文600字：说说我们90

美联储官员讲话仍偏鹰派国际黄金高位滞涨|天天时快讯

哈姆：我们拿下了G1但很不幸没拿下G2 这次客场之旅还不错天天短讯

百余个品种轮流绽放高山花卉也能在盆地盛开

工行节节高是理财吗_工行节节高2号是骗局焦点快看

通讯！注意防范！青岛发布大雾橙色预警局部能见度小于50米

美联储官员鹰派言论点燃加息预期美股三大指数涨跌不一|最新消息

宜信惠普是做什么的宜信惠普

曲剧《鲁镇》将在国家大剧院上演，融汇鲁迅多部名作环球即时

雷军下手太狠！小米13 Ultra居然5999起定价，连夜说服高管奏效了环球报道

科技股再次领涨，两个方向值得关注今日热搜

发改委：正在抓紧研究起草关于恢复和扩大消费的政策文件百事通

【世界报资讯】2023上海车展：看得见买不着的流量新担当红旗L5了解一下！

标准化促进适老化旅游生活更幸福

市场监管总局：严查刷单炒信网络直播虚假宣传等网络不正当竞争行为_每日观点

世界热议:全面部署全省土壤普查工作

工程部岗位职责及任务工程部岗位职责

全球时讯：中东部将迎“俯冲式”降温南方新一轮降雨明日登场

2023上海车展：新款路虎揽胜星脉亮相并开启预订环球头条

鲁源日升二期生物制药产业园项目开工建设天天快播报

滨医烟台附院介入血管外科成功举办血管疾病科普沙龙头条焦点

pointwise下载（pointpower2003下载）速看料

单机传奇假人每次登录都重置了吗热血传奇单机假人版

全球热头条丨世昕股份2022年净利605.32万同比增加72.65% 技术服务收入增加

沙尘暴背后的国度：蒙古到底怎么了？天天热点评

优良品种、大豆油料、种业振兴……农业农村部发布会“干货”满满今日聚焦

国家统计局：今年二季度经济增速可能比一季度明显加快快播

康德莱(603987.SH)：2022年净利润增长6.97%至3.12亿元拟10派2.2元|焦点热讯

知乎又又又崩了！网友：影响我摸鱼了目前已恢复正常|环球滚动

五一出游正升温文旅复苏绽新颜详细内容

全球快看点丨构建产学研用一体化水产种业发展体系陵水水产南繁产业将迎来新机遇

大宗交易：嘉应制药成交6058.8万元，成交价7.92元（04-18）全球快报

海信家电今日涨停四机构净买入1.79亿元前沿热点

高速路上莫“回头”，司机匝道口倒车被扣12分天天热文

美战略轰炸机现中印边境印媒：已获购买权

公积金缴费比例越高越好么答案在这里快资讯