学而思计划推出自研数学大模型称主要面向全球数学爱好者

2023-05-05 22:06

经济观察网记者李静 5月5日，经济观察网获悉，学而思正在进行自研数学大模型的研发。该模型被命名为MathGPT，主要面向全球数学爱好者和科研机构，以数学领域的解题和讲题算法为核心，目前已经取得阶段性成果，并将于年内推出基于该自研大模型的产品级应用。

学而思方面称，公司已将MathGPT作为核心项目，由CTO田密负责，今年春节前，该项目已经启动相应的团队建设、数据、算力准备和技术研发。此外，学而思已经启动在美国硅谷的团队建设，将成立一支海外算法和工程团队，在全球范围内招募优秀的人工智能专家加入。

今年以来，大模型备受市场关注。美国OpenAI公司在今年三月份发布了大语言模型GPT-4，国内百度、阿里也发布了各自的大模型产品，但通用语言模型更像一个“文科生”，在语言翻译、摘要、理解和生成等任务上有出色表现，但在数学问题的解决、讲解、问答和推荐方面则存在稍显不足。

“这种不足是由LLM模型的自身特点决定的。”学而思AI团队负责人介绍，LLM大模型来自对海量语言文本的训练，因此擅长语言处理。行业内偏向基于LLM大模型做阅读、写作类应用，但如果想要在数学能力上有所突破，就需要研发新的大模型。因此，学而思决心组建团队专研MathGPT——数学领域大模型，用自己在数学和AI上的多年积累，面向全球范围内的数学爱好者和科研机构，做好AI大模型时代的数学基础工作。

学而思希望通过MathGPT弥补和攻克大语言模型的三个问题：第一，题目要解对，现在GPT结果经常出现错误；第二，解题步骤要稳定、清晰，现在GPT的解题步骤每次都不一样，而且生成内容经常很冗余；第三，解题要讲得有趣、个性化，现在GPT的解释过于“学术”和机械，对学习体验并不友好。

据公开信息显示，基于智慧教育人工智能开放创新平台助力，学而思AI lab获得各类顶级学术会议比赛冠军16项，亚军6项；发表国际期刊和会议高水平学术论文31篇，包含光学字符识别、图像、自然语言处理、语音以及多模态等多领域的学术研究，在计算机视觉顶会以及自然语言顶会中均有多篇论文发表；申请专利220余项，授权专利150余项，软件著作权60余项。

另据了解，学而思学习机近期将会上线一款“AI助手”，涵盖作文助手、口语助手、阅读助手、数学助手等相关功能，该AI产品将于5月11日开启内测。