luyuanhong 发表于 2023-1-25 19:04

Chat-GPT 可以做数学吗?

Chat-GPT 可以做数学吗?

撰文 | George Shakan

翻译 | 蒋迅

译者注:本文试图说明 Chat-GPT 在数学证明领域里还有缺陷。所以下面除了最基本的问题外,Chat-GPT 给出的证明都是不正确的。请读者不要把这里的证明当作标准答案。

Chat-GPT 是 Open AI 发布的令人印象深刻的全新 AI 聊天机器人。它令人印象深刻的应用程序可以在整个互联网上找到。但它能做数学吗?

通过数学,我们并不意味着简单地做一些计算。它自己的设计确保了存在着它无法解决的计算问题。我更感兴趣的是它可否解决需要一些数学推理的问题。

为了选择我们的问题,我们使用了 MMLU 数据集。Meta AI 最近发布的大型语言模型 Galactica 在这个数据集上取得了一些不错的结果。他们的发现陈述在他们论文的第 5.3 节中。

接下来,我们将挑选几个问题,看看 Chat-GPT 如何处理它们。如果失败,我们将尝试改写这个问题以期获得部分结果。

我们注意到 MMLU 数据集有多项选择题,但我们只是将问题呈现给 Chat-GPT 。我们只是从 MMLU 的抽象代数部分选择问题。

之后,我们将刺激 Chat-GPT 以获得直觉和证明。在最后,我们将向数学家推荐 Chat-GPT 的一些应用。

问题一



注: Chat-GPT 完美地回答了这个问题并给出了极好的解释。公平地说,这是一个较简单的问题。

问题二



注: 同样,Chat-GPT 是正确的。但是,这个问题我问了几次,有一次说了 1 ,有一次说了 2 却给出了错误的理由:

Z(整数)到Z2(整数模 2)只有两个同态。

一个同态将每个整数映射到 0 ,另一个同态将每个整数映射到 1 。

问题三



注: 哇!这是非常错误的!第一句话是完全错误的。还有,它最后的结论,1/30 连整数都不是,这肯定是不对的。事实上,子群的指数是有一定意义的,而且大多数是正整数。

不过,我们能够挽救一些东西。假设我们使用代数技巧计算出 <p> 的阶数为 5 。然后我们可以使用以下提示 Chat-GPT 。



注: 在这里,Chat-GPT 正确回答并给出了一个完美的解释。也许最好提一下所使用的主要事实是拉格朗日定理,尽管这可以很容易地通过问它“上面你使用了什么定理?”来获得。

但是直觉是什么?

使研究数学家伟大的是对问题的某种“直觉”。让我们看看 Chat-GPT 是否可以解释其中的任何一个。



注: 这还算不错,但肯定可以改进。例如,解释什么时候柯西-施瓦茨不等式何时成立(当一个向量是另一向量的倍数时)有助于给出最后一段更精确的含义。人们可以看到陶哲轩这篇博客文章的前几段,以了解来自世界领先数学家之一的解释。此外,这是 Stackexchange 上关于该主题的数学讨论。

给出证明



注: 不幸的是,这个证明并不完全正确。无论是证明方法还是细节(即它对 AM-GM 的应用)都存在严重缺陷。

结论

老实说,Chat-GPT 对于一个无论如何都不是为数学量身定做的模型来说是相当令人印象深刻的。我认为,以目前的格式,它已经可以帮助数学家准备讲义甚至论文中更简单的部分。也许它最大的用处在于自动处理基金和工作申请的某些部分。

本文转载自微信公众号“遇见数学”。

原文链接:https://gshakan.wordpress.com/2023/01/02/can-chat-gpt-do-math/
页: [1]
查看完整版本: Chat-GPT 可以做数学吗?