清华大学孙茂松：“百模大战”不是贬义，建议深耕行业的垂直应用

当前位置：首页 > 新闻中心 > 专题报道 > 浦江基础科学发展论坛 > 最新报道 > 正文

发布日期：2023-07-27 来源：上海科技

　　今年5月发布的《中国人工智能大模型地图研究报告》显示，我国已有79个10亿级以上参数规模的大模型。对于“百模大战”，清华大学人工智能研究院长聘教授、常务副院长孙茂松说，这并非一个贬义词，而是我国人工智能的一个实力象征。

　　7月25日，“浦江基础科学发展论坛”进入第二天，他在接受记者采访时说，“百模”并非无源之水，早在2010年国内就已跟进大模型研究，在学术界和工业界一直都很“热”，只不过这次ChatGPT点了一把“火”。“之前我们和国际先进水平相差半个肩位，ChatGPT的出现一下甩出‘100米’，经过这半年的追赶缩短了‘30米’，但还没有质的变化。目前ChatGPT用于专业领域还不行，建议‘百模’在提升基础模型能力基础上，深耕行业的垂直应用。”

　　ChatGPT如何获得“举一反三”的能力

　　对于ChatGPT的横空出世，孙茂松曾将其比喻为通用人工智能的“幽灵”。“确实振聋发聩，因为看其算法，即使按照人工智能专家的理解，也不应该有这么好的结果，但它却出现了。”

　　“不要小看了ChatGPT的‘对话’能力，这看上去简单实际很复杂。”他说，就以说话要“通顺“为例，不仅要符合词法、句法、语义，还要和现实对齐，这是过去的计算机所做不到的。如果从行为主义角度来看，机器的情感表达相比语义表达都要容易得多，难的是组织语言。只有人类才拥有语言能力，相信ChatGPT的对话能力会催生一系列应用。

　　ChatGPT究竟如何获得“举一反三”的能力？孙茂松说，目前依然是“知其然但不知其所以然”。就连推出ChatGPT的OpenAI公司首席执行官萨姆·奥特曼也表示，他们做出了这个现象，但为什么会发生不甚清楚。“实际上就是对其机理还不清楚，历史上也有不少这样的例子。”他介绍，瓦特在不明原理的情况下发明了蒸汽机，导致了工业革命，后来才有了热力学三大定律。

　　“如果弄清楚了ChatGPT背后的机理，就有可能克服现有人工智能大模型的局限性，建立下一代人工智能的理论和模型。”孙茂松说，比如，让ChatGPT写短篇小说肯定不行，因为它对语料的利用还是很不足，无法保持逻辑的流畅，也无法保证人物角色的连贯性。

　　人工智能机理的突破，需要数学的助力。在他看来，人工智能所倚重的深度神经网络，其内涵都是数学和算力，就算是让人工智能写首诗，背后也是计算。“这里涉及的大数据是万亿级的，数学家还从来没有解过这么大的方程组，这对他们也是新的考验。”

　　如何减少“一本正经地胡说八道”

　　鲁迅和周树人是同一个人吗？对于这样的提问，ChatGPT也会“一本正经地胡说八道”。如何减少这一现象？孙茂松建议，人工智能在深度学习时可以利用搜索引擎，结合来自权威渠道的相关信息。“这是个热点问题，估计两到三年后，会有比较大的改善。”

　　他提醒有必要关注ChatGPT会软性地影响人的思想和文化，“一项调查显示，现在许多年轻人选择养猫，一个重要原因是，猫不太黏人。它背后的原因很深刻，意味着我不找你时别来烦我。比如面对一个用ChatGPT武装的人形机器人，它特别善解人意，就像猫一样，年轻人会不会更愿意和它聊天，会不会不愿意谈恋爱了？”

　　提及文化，喜欢人文社会学的孙茂松和国内许多中文系都有交流。他所在的清华大学计算机系自然语言处理与社会人文计算实验室，在国内最早开展自然语言处理研究，之前做过古诗词大模型，眼下正在做古文大模型。

　　他的团队还用大模型做汉语教育，在上海市科委支持下，开发了国内第一款“反向词典”的应用程序。“受欢迎程度超乎我们想象。人都有‘词穷’的时候，只需输入想表达的意思，它会帮你找出合适的词语。”

【纠错】【推荐】【打印】【关闭】