|
今年5月发布的《中国人工智能大模型地图研究报告》显示,我国已有79个10亿级以上参数规模的大模型。对于“百模大战”,清华大学人工智能研究院长聘教授、常务副院长孙茂松说,这并非一个贬义词,而是我国人工智能的一个实力象征。
7月25日,“浦江基础科学发展论坛”进入第二天,他在接受记者采访时说,“百模”并非无源之水,早在2010年国内就已跟进大模型研究,在学术界和工业界一直都很“热”,只不过这次ChatGPT点了一把“火”。“之前我们和国际先进水平相差半个肩位,ChatGPT的出现一下甩出‘100米’,经过这半年的追赶缩短了‘30米’,但还没有质的变化。目前ChatGPT用于专业领域还不行,建议‘百模’在提升基础模型能力基础上,深耕行业的垂直应用。”
ChatGPT如何获得“举一反三”的能力
对于ChatGPT的横空出世,孙茂松曾将其比喻为通用人工智能的“幽灵”。“确实振聋发聩,因为看其算法,即使按照人工智能专家的理解,也不应该有这么好的结果,但它却出现了。”
“不要小看了ChatGPT的‘对话’能力,这看上去简单实际很复杂。”他说,就以说话要“通顺“为例,不仅要符合词法、句法、语义,还要和现实对齐,这是过去的计算机所做不到的。如果从行为主义角度来看,机器的情感表达相比语义表达都要容易得多,难的是组织语言。只有人类才拥有语言能力,相信ChatGPT的对话能力会催生一系列应用。
ChatGPT究竟如何获得“举一反三”的能力?孙茂松说,目前依然是“知其然但不知其所以然”。就连推出ChatGPT的OpenAI公司首席执行官萨姆·奥特曼也表示,他们做出了这个现象,但为什么会发生不甚清楚。“实际上就是对其机理还不清楚,历史上也有不少这样的例子。”他介绍,瓦特在不明原理的情况下发明了蒸汽机,导致了工业革命,后来才有了热力学三大定律。
“如果弄清楚了ChatGPT背后的机理,就有可能克服现有人工智能大模型的局限性,建立下一代人工智能的理论和模型。”孙茂松说,比如,让ChatGPT写短篇小说肯定不行,因为它对语料的利用还是很不足,无法保持逻辑的流畅,也无法保证人物角色的连贯性。
人工智能机理的突破,需要数学的助力。在他看来,人工智能所倚重的深度神经网络,其内涵都是数学和算力,就算是让人工智能写首诗,背后也是计算。“这里涉及的大数据是万亿级的,数学家还从来没有解过这么大的方程组,这对他们也是新的考验。”
如何减少“一本正经地胡说八道”
鲁迅和周树人是同一个人吗?对于这样的提问,ChatGPT也会“一本正经地胡说八道”。如何减少这一现象?孙茂松建议,人工智能在深度学习时可以利用搜索引擎,结合来自权威渠道的相关信息。“这是个热点问题,估计两到三年后,会有比较大的改善。”
他提醒有必要关注ChatGPT会软性地影响人的思想和文化,“一项调查显示,现在许多年轻人选择养猫,一个重要原因是,猫不太黏人。它背后的原因很深刻,意味着我不找你时别来烦我。比如面对一个用ChatGPT武装的人形机器人,它特别善解人意,就像猫一样,年轻人会不会更愿意和它聊天,会不会不愿意谈恋爱了?”
提及文化,喜欢人文社会学的孙茂松和国内许多中文系都有交流。他所在的清华大学计算机系自然语言处理与社会人文计算实验室,在国内最早开展自然语言处理研究,之前做过古诗词大模型,眼下正在做古文大模型。
他的团队还用大模型做汉语教育,在上海市科委支持下,开发了国内第一款“反向词典”的应用程序。“受欢迎程度超乎我们想象。人都有‘词穷’的时候,只需输入想表达的意思,它会帮你找出合适的词语。”