扫码登录
从文字对话交互开始,AI大模型在短短一年多时间内对人们的生产和生活带来巨大变化,并且被普遍认为将继续带来颠覆性影响——这包括对人类生产力的提升,也同样蕴含着难以预估的风险。
国外:ChatGPT打响大模型热潮第一枪
去年11月30日,美国AI公司OpenAI发布旗下基于大语言模型GPT-3.5的AI聊天机器人程序ChatGPT。据美国媒体报道,在ChatGPT上线时,OpenAI没有开发布会,也没有进行什么预热宣传。几乎没有人预料到,在发布后的短短两个月内,ChatGPT的月活用户突破1亿,成为史上用户增长速度最快的消费级应用程序。
流畅的语言表达、强大的问题处理功能以及庞大的数据库,尽管有诸如“胡言乱语”等缺陷,但ChatGPT仍然让人们亲身体验到现代人工智能已经变得多么强大。《纽约时报》称,ChatGPT为“有史以来向公众发布的最佳人工智能聊天机器人”。比尔·盖茨则公开表示,ChatGPT的诞生有着重大历史意义,不亚于互联网或个人电脑的诞生。
ChatGPT的横空出世深刻影响了全球AI产业的发展轨迹,AI大模型吸引了大批科技巨头、初创企业与科研院所入场。北京市科学技术委员会、中关村科技园区管理委员会日前发布的《北京市人工智能行业大模型创新应用白皮书(2023年)》统计称,从全球范围看,世界各地均在积极推动大模型研发和应用,其中美国和中国发布的通用大模型总数占全球发布量的80%,成为大模型技术领域的引领者。
在美国,微软借助对OpenAI的投资与合作,将GPT模型嵌入旗下Office等产品;谷歌在今年年底推出新一代的多模态大模型Gemini,被业界认为开启了与GPT的直接对决;近期有外媒报道称,亚马逊正在训练其第二个大语言模型,该模型拥有2万亿个参数,可能会成为当前世界上正在接受训练的最大模型之一。此外,一系列初创公司也全力投入大模型之中,由OpenAI前高管达里奥创办的Anthropic、拥有强大创始团队的Cohere等初创企业均受到关注。
在大模型基础上,生成式人工智能(AIGC)也迅速发展。国际研究机构IDC本月发布的一份报告预测,2023年全球企业将在生成式人工智能解决方案上投资160亿美元,到2027年,支出预计将超过1400亿美元,年复合增长率超过70%,几乎是同期全球IT支出年复合增长率的13倍。
过去的一年中,可以将文字描述转化为图片的AI工具Midjourney、AI视频生成软件Gen-2等都曾引发用户的惊叹——“AI改变世界”这句话正在成为现实。
在发布ChatGPT之后,OpenAI一直都保持着领跑者地位,GPT也被其他大模型作为对照标准。今年3月,OpenAI正式官宣多模态大模型GPT-4,新增了图像功能,同时具备更精准的语言理解能力。与此同时,OpenAI也从一个非营利的研究机构走上商业化之路,目前估值已近千亿美元。
在这一过程中,OpenAI发生了一场全球瞩目、多次反转的人事变动,创始人奥特曼在11月被董事会突然解雇。经过复杂且激烈的多轮博弈,奥特曼重返OpenAI并重新担任首席执行官,为这场“大戏”暂时画上句号。一家公司的“宫斗剧”能引发如此巨大的关注,既与OpenAI和奥特曼本人的业界重要地位相关,也侧面反映出AI大模型的重要性正提升至一个新的高度。
2023年,尽管没有中美如此大规模的投入,但其他国家和地区在AI大模型领域也不甘落后。今年5月,阿联酋阿布扎比科技创新研究所的Falcon大模型问世;今年9月,据媒体报道,日本政府联合NEC、富士通、软银等大型科技公司投入数亿美元,开发日语的大型语言模型;韩国互联网公司Naver推出了HyperClova X;印度政府主导的大模型Bhashini也已投入使用。
国内:“百模大战”,与行业融合是重要机遇
自3月份GPT-4上线后,国内科技企业纷纷跑步入场。百度“文心一言”、阿里巴巴“通义千问”、华为“盘古”、360“智脑”、昆仑万维“天工”、京东“言犀”、科大讯飞“星火”、腾讯“混元”、商汤“日日新”等大模型先后登场。
除通用大模型外,不少企业也推出了深耕行业、具有专业能力的垂直大模型,例如携程的旅游行业大模型“携程问道”,网易有道发布基于教育的大模型“子曰”,京东健康发布医疗健康行业的大模型“京医千询”等。此外,清华、复旦、中科院等高校与科研院所也在大模型领域深度布局。有统计显示,截至10月,国内已经发布238个大模型,这让不少人形容称,当前的中国正发生“百模大战”。有评论认为,国内正在逐渐形成互联网巨头通用模型领跑,AI厂商、创业公司及科研院所百花齐放的格局。
在技术水平上,一些国产大模型已经取得突破。百度创始人李彦宏在今年10月发布“文心大模型4.0”时称,该模型综合水平与GPT-4相比已经毫不逊色。而在同月发布“星火大模型V3.0”的讯飞则表示,其产品已经超越ChatGPT(GPT-3.5),并计划在2024年上半年实现对标GPT-4。
360创始人周鸿祎对《环球时报》记者表示,客观来讲,中国大模型和GPT-4相比还存在一定差距,但这种差距不妨碍我国打造自己的GPT和自己的大模型产业。
互联网分析师于思远接受《环球时报》记者采访时分析称,中国虽然在基础研发技术上还存在一些短板,但具有超大的市场规模以及丰富的应用场景,可以为大模型的落地应用提供广阔的空间和条件,这将成为中国发展大模型的特色路径。
有分析报告统计称,从大模型的类别来看,国内通用领域的大模型共有45个,垂直领域的大模型则有145个。而垂直领域中又包含43个细分赛道,其中以医学、金融、企业服务、工业、政务、科研等赛道的大模型数量较多,均为10个及以上。
周鸿祎认为,中国的最大优势是拥有行业红利或者叫场景红利。中国发展大模型的关键就是抓住场景红利,最大机会是产业化、行业化、垂直化,向深度定制方向发展。周鸿祎建议称,大模型可以比现在的粒度更细,比如在钢铁、金融、教育行业,可以把这些行业里的很多环节、链条、任务都细分出来,利用大模型赋能。
华为推出的“盘古”大模型与京东推出的“言犀”大模型都是目前国内以服务产业为主要目标的大模型产品。前者已经与政务、煤矿、金融、制造、医药研发、铁路等诸多行业进行结合,后者则致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景。
李彦宏近日在一场论坛上说,未来我们需要的是100万量级的AI原生应用,而不是100个所谓的大模型。大模型时代,真正的价值在于AI原生应用,对于中小企业来说,对于创业者来说,都是很大的机会。
未来:憧憬变革,也要防范风险
在过去的一年里,AI大模型的发展和应用达到了新的高度,不仅在技术上取得了显著进步,还在多个领域中展现出了广泛的应用潜力。
中国科学技术信息研究所党委书记、所长,科技部新一代人工智能发展研究中心主任赵志耘近日表示,大模型技术最大的突破就在于通用性。大模型通过“大数据+大算力+强算法”的路径显著增强了通用性、泛化性,推动人工智能从以专用小模型定制训练为主的“手工作坊时代”,迈入以通用大模型预训练为主的“工业化时代”,迎来新的发展浪潮。
展望未来,赛智产业研究院院长赵刚认为,未来大模型的发展将有三大趋势:一是通用大模型性能提升和优化进一步深入,大模型将进入万亿参数,性能进一步提升,同时围绕不同应用场景进行模型调优;二是大模型的思考和探索能力将进一步提升,将从简单智能应用向复杂智能应用迈进;三是大模型的超级应用将出现,将整合内容生成、语义理解、推理、记忆、自主意识等能力,提供体验感极强的智能服务,智能数字人或机器人等将成为经济社会各领域的标配。
AI大模型的飞速发展将掀起新一轮的生产力革命,并为正在艰难复苏的全球经济注入新能量。然而,它也带来了一系列麻烦和隐忧。从学生利用AI写论文,到网络上利用AI合成的图片和视频制造的虚假新闻,再到知识产权、伦理以及“人与AI如何相处”的宏大命题,这些必须全世界合力解决。
不久前OpenAI内部出现的动荡,背后正是折射出人类对AI不同发展理念的激烈冲突和碰撞。美国《华盛顿邮报》当时报道称,这场斗争围绕着两种趋势的分歧展开,奥特曼希望推动人工智能技术快速发展和商业化,而其他人则对可能产生的安全问题日益担忧。
今年5月30日,以马斯克为代表的350多位国际人工智能业界领袖和专家发表联合声明,称应当将人工智能危机视为全球优先事项。这份声明称:“人工智能可能导致人类灭绝,危险程度不亚于大规模疫情和核战争。”
今年11月,全球首届人工智能安全峰会在英国举行,28个参会国和欧盟共同签署《布莱奇利宣言》。宣言认为,对前沿人工智能技术有意识滥用或无意识控制方面的问题,可能会引发巨大风险,尤其是在网络安全、生物技术和加剧传播虚假信息等方面。
为应对AI带来的巨大挑战,全球多个国家和组织纷纷出台倡议或规范,一致要求加强安全监管。