??????????????

频道：手游攻略日期：2026-03-22 12:25:27 浏览：385

您好！我是人工智能助手智谱清言（ChatGLM），是基于智谱 AI 公司于 2024 年训练的语言模型开发的。我的目标是针对用户的问题和要求提供适当的答复和支持。

上海AI Lab复刻OpenAI奥数神器，LLaMA版o1开源

近年来，人工智能在各个领域的应用越来越广泛，特别是在数学领域，AI技术已经取得了显著的成果。2024年11月5日，上海AI Lab团队宣布成功复刻了OpenAI的奥数神器——o1，并将其开源，命名为LLaMA版o1。

早在OpenAI的o1系列发布之前，上海AI Lab团队就开始探索利用蒙特卡洛树搜索来提升大模型的数学能力。o1发布后，团队进一步升级算法，专注于数学奥赛问题，并将其作为OpenAI草莓项目的开源版本进行开发。

为了提升LLaMA模型在数学奥赛问题上的表现，团队采用了成对优化策略，即不直接给出答案的绝对分数，而是比较两个答案的相对优劣。通过这种方法，他们在最难的AIME2024基准测试中取得了显著进步。在30道测试题中，优化后的模型做对了8道，而原版LLaMA-3.1-8B-Instruct模型只做对了2道。这一成绩超过了除o1-preview和o1-mini之外的其他商业闭源方案。

LLaMA版o1开源内容丰富

目前，LLaMA版o1已开源的内容包括：预训练数据集、预训练模型、强化学习训练代码。其中，OpenLongCoT-Pretrain数据集包含超过10万条长思维链数据，每条数据都包含一个完整的数学问题推理过程，包括思考内容、评分结果、问题描述、图形坐标、计算过程、结论推导等完整的推理链路，以及对各个推理步骤的详细评分。

基于AlphaGo Zero架构复刻OpenAI o1

10月底，团队宣布在基于AlphaGo Zero架构复刻OpenAI o1方面取得重大进展，成功使模型在学习过程中通过与搜索树交互获得高级思维能力，而无需人工标注。不到一周，项目便开源了。

MathorCup杯B题思路分享

2024年11月1日，MathorCup杯B题的思路分享引起了广泛关注。该题目要求在机器学习的框架下，使用线性回归作为一种算法来解决预测问题。然而，直接应用机器学习可能因库存数据量较少而导致误差较大。

为了解决这个问题，参赛团队首先使用机器学习对数据进行简单的线性拟合（三次埃尔米特插值），以增强数据的连续性和特征丰富度。完成拟合后，再将数据划分为训练集和测试集，并对其进行机器学习建模和预测。

澳洲今年最新高考数学题引发热议

2024年10月22日，澳洲新州高考（HSC）的数学试卷让不少12年级学生陷入困境。题目之复杂连有着澳洲最著名数学老师”称号的Eddie Woo也不得不花了三次才解出一道题。

此次的标准2和高级数学考试包含八道相同题目，许多报考标准课程的学生纷纷抱怨，这次的试卷难度远超以往。其中，一道关于复利的金融数学问题（Question 41）引发了学生和老师间的广泛讨论。

苹果研究人员质疑AI的推理能力

2024年10月12日，苹果公司的一组研究人员发布了一篇名为《理解大型语言模型中数学推理的局限性》的论文，揭示LLM在解决数学问题时容易受到干扰。研究人员通过对数学问题的微小改动，例如添加无关的信息，来测试LLM的推理能力。

例如，当研究人员给出一个简单的数学问题：奥利弗星期五摘了44个奇异果，星期六摘了58个奇异果。星期日，他摘的奇异果是星期五的两倍。奥利弗一共摘了多少个奇异果？”时，LLM能够正确地计算出答案。然而，当研究人员添加一个无关的细节，星期日，他摘的奇异果是星期五的两倍，其中5个比平均小”时，LLM的回答却出现了错误。