分享各种百科|日常

18常识网 > 餐饮行业新闻资讯 > 百科|常识 > ChatGPT成8岁娃导师，外国家长们慌了！ ChatGPT 最强竞争对手 Claude 2 推出公开 Beta 版，我们上手实测了一把！

ChatGPT成8岁娃导师，外国家长们慌了！ ChatGPT 最强竞争对手 Claude 2 推出公开 Beta 版，我们上手实测了一把！

发布时间：2024-09-02 09:53:03 来源：网络整理浏览：【大】【中】【小】

ChatGPT成8岁娃导师，外国家长们慌了！ ChatGPT 最强竞争对手 Claude 2 推出公开 Beta 版，我们上手实测了一把！，

ChatGPT成8岁娃导师，外国家长们慌了！

新智元报道

编辑：乔杨好困

【新智元导读】GenAI的这股风不知不觉也刮到了学校课堂中。根据外媒报道，美国、英国、韩国等地的中小学逐渐开始推行「AI教育变革」。为什么被一众大学禁止的ChatGPT类AI工具，反而要在中小学推广？

虽然OpenAI还没靠AI大模型真正实现盈利，GenAI已经迎来了一个坚实的用户群体——各国的中小学。

根据《金融时报》、《华盛顿邮报》、《纽约时报》等多家媒体的报道，已经有不止一个国家和地区计划在中小学课堂上使用AI辅助教学。

AI走入中小学课堂

伦敦的一所私立学校David Game College高中正在使用ChatGPT等人工智能工具取代教师，以帮助一些学生准备考试。

在这所学校9月开始的试点计划中，20名15岁左右的学生将在参加GCSE（中等教育通用证书，相当于高中文凭）考试之前使用人工智能工具一年，备考科目包括英语、数学、生物、化学和计算机科学。

除了AI工具，每名学生还将配备三名全职学习教练，以获得个性化的学习路径。

在AI技术氛围更浓厚的加州，甚至有年龄更小的孩子开始在学习过程中使用AI工具。

即使美国各地的学校都禁止使用ChaGPT，防止作弊或模型幻觉对学生造成长期伤害，可汗实验室学校依旧引入了与OpenAI合作开发的模型Khanmigo。

可汗实验室学校依旧是一所私立学校，每年的学费超过3.1万美元。由于地处硅谷，许多学生家长本就身处AI行业，学生们也对各种技术概念十分熟悉。

可汗学院创始人Salman Khan表示，「大多数家长对此都非常兴奋并能看到其中的力量，他们只是想要合理的护栏。」

8岁的Alisha Agrawal在人工智能导师Khanmigo的帮助下，在加州Palo Alto的可汗实验室学校进行课堂练习

以上的教育试验都只停留在个别的私立学校层面，而韩国的行为似乎更加激进，他们已经从教育部开始自上而下地在全国范围内引入由AI驱动的数字教科书。

韩国教育部长表示，有AI功能的平板电脑，是教育系统改革中的「关键」。这项技术由LG、三星等韩国公司开发，他们计划明年引入，面向年仅8岁的学生。

到2028年，除音乐、美术、体育和思想品德外，所有学科都将引入AI相关的app，教师可以通过数字仪表板监控学生的活动。

除了教科书，也将引入其他方面的AI工具，包括课堂对话的自动转录系统和回答学生提问的移动机器人。

与此同时，学生将接受数字素养方面的培训，以学会如何负责任地部署、使用使用AI工具。

对于这项改革计划，官方解释如下：

「我们都同意需要从单向的、以记忆为基础的课堂，转变为学生可以参与并掌控学习的空间。2025年是这一变革的关键节点，我们需要利用AI教科书来帮助教师转变课程模式。」

省钱省力，还能因材施教

为什么这么多国家的学校要争先恐后地在课堂中部署AI？仅仅是因为「时髦」吗？

在很多决策者看来，用AI辅助教学有诸多好处。首先是更好地促进「因材施教」，促进学生主动的创造性学习。

根据《金融时报》的分析，虽然韩国在OECD组织的对各国学生的评估测试中一直名列前茅，但首尔政府担心传统的以记忆为基础的学习方法正在扼杀创新，因此AI才成为了这场教育改革的关键。

根据韩国教育部的说法，他们将采用可定制平板电脑，AI软件可以根据每个学生的数据评估其学习水平和进度，分辨出「快速学习者」和「慢速学习者」，从而生成不同复杂程度的任务，为每个人提供量身定制的教育。

大量的韩国学生都会进行课下补习，导致同一课堂往往存在不同的进度——有些人因为学过觉得太简单因而昏昏欲睡，其他人则跟不上课程。

教育部官员表示，AI教科书可以解决这个问题：「因为它能为任何情况提供各种内容，激发学生的学习兴趣并帮助他们进行创造性思考。」

伦敦David Game College的校长John Dalton也表达了类似的看法。

班级的整体进度并不适用于每个人，而AI驱动的自适应学习将让学生受益匪浅。他们可以按照自己的节奏来，不必强求必须与整个班级保持一致。

Dalton表示，这种「因材施教」的方法可以大大提高教授核心科目的效率，学校可以利用剩余时间发展「素质教育」，比如关注学生的自我意识、批判性思维、积极的公民意识、数字素养、艺术表达、公共演讲和企业家精神等等。

参与试点的这20名学生就将在下午参加「多样化的辅助课程」，包括学习如何辩论、培养创业技能、探索AI和金融素养，并参与烹饪和绘画等创意活动。

此外，不同于和人类教师的互动，学生们可以放心大胆地向AI助手提出那些可能让教师感到不适的问题。即使学习速度缓慢或者犯错，也不必担心来自AI教师的评判。

让学生在一个安全的环境中按照自己的节奏学习，可以增强他们的自信心，在促进知识掌握的同时改善心理健康。

此外，Dalton补充说，引入AI教学并不代表完全排除人类教师的参与，「如果学生愿意，他们仍然可以和老师互动」。

除了这些直接优势外，一些教育工作者还看到了其他方面的价值。

他们认为，这可以帮助解决英格兰多年来面临的教师短缺和过度劳累问题。随着班级规模的不断扩大，教师和学生之间缺乏一对一互动的负面影响，或许也能用AI弥补。

家长不满，老师针锋相对

韩国教育部引入AI教科书的计划受到许多教师的欢迎。根据教师协会的统计，54%的公立学校教师表示支持。

然而，这个计划引起了许多家长的强烈反对，他们担心这会让孩子过度接触数字设备，以及受到AI给出的潜在错误信息的影响。

已经有超过5万名家长签署请愿书，要求政府更加关注学生的整体福祉，其中写道：「作为家长，因为孩子们接触数字设备，我们已经遇到了许多前所未有的问题。」

41岁的Lee Sun-young是两个学龄儿子的母亲，她表示，与AI教科书相比，她更希望看到更多的课后辅导老师来帮助学生。

「我担心，过多使用数字设备可能会对他们的大脑发育、注意力时长和解决问题的能力产生负面影响——他们已经过度使用智能手机和平板电脑了」。

首尔中央大学社会学教授Shin Kwang-Young也不认同这种改革措施，他表示，「政府过于仓促地推出AI教科书，而没有正确评估其副作用，只是因为人工智能是当今的大趋势」。

在课堂上使用AI技术会引来多方面的风险，考虑到虚假信息、剽窃和泄露学生个人信息的潜在可能性。课堂上的人工智能面临着「失控」的风险。

而在韩国教育部的计划中，并没有说明这类AI教育工具将如何运作，以及如何防止人工智能产生幻觉或错误的倾向。

Shin Kwang-young补充说，想要转变「死记硬背」的学习模式是合理的，但需要「适当地」改革教育系统，包括考试方法，而非一味寄希望于AI。

教育咨询公司Higher Learning Group总监Hadida Grabow的看法相对乐观一些，但她依旧认为AI无法取代高水平的人类教师，只能作为有价值的辅助工具。

虽然我们看到了一些「有前景的案例」，比如谷歌的Socratic和可汗学院的AI教学助手，但Grabow表示：「我们没有看到任何可以替代高质量教育者的东西。」

在可汗学院对Khanmigo的使用中，我们最无法忽视的，是AI可能给出的错误信息和幻觉。

在使用AI的过程中，教师们需要始终提醒学生「Khanmigo可能会犯错」、「需要始终仔细检查从Khanmigo那里获得的任何信息」。

此外，AI系统无法判断学生的语气或面部表情，而这些是「教学时判断学生是否理解的关键指标」。

泰晤士报的意见撰稿人Jessica Grose长期报道教育领域，今年以来她撰写了多篇有关在课堂上使用最新AI技术的报道。

采访了多名中学和大学教师关于AI的使用体验后，她的总体看法是：尽管在学校使用AI有一些实际的好处——比如更快地添加引用以及完成基本编码等机械任务——但缺点是显著的。

Leila Wheless从1991年开始进入教育行业，她尝试对中学的英语和语言艺术课堂使用AI保持「开放的心态」，但学生们使用AI的结果令人沮丧。

她给学生布置了研究「先知」的作业，结合AI进行搜索后，她的学生给出了这样的答案：「基督教先知摩西因去除T恤上的巧克力污渍而闻名。」

令Wheless更惊讶且难以理解的是，这名学生甚至没有想到问一问老师来求证这个荒谬的结果。

虽然AI会产生幻觉和谬误是几乎人尽皆知的事实，但八年级的学生似乎没有相关的背景知识，也缺少智识方面的耐性去质疑AI给出的答案。

这个案例让我们看到，使用AI最大的问题或许不在于作弊——毕竟学生们一直以来都在用各种工具尝试作弊——或者得到荒谬的错误答案。

更棘手的问题是，当学生将头脑风暴和写作外包给ChatGPT这样的GenAI工具时，他们可能正在失去批判性思考的能力，而且难以在完成艰难任务的过程中获得克服挫折感的能力。

在加州教授高中英语的Sarah Martin表示，比猖獗的作弊和学术不端更令她困扰的是，这些学生身上不再有任何「韧性」。

在她教书的七年中，学生们愿意花在挑战性任务上的时间变得越来越短。

以前，很多学生会花几天时间自我斗争尝试掌握一个概念。但现在，如果学生们无法在几分钟内理解，就可能直接放弃脑力方面的努力，寻找替代方案，无论是聊天机器人还是向朋友求助。

今年4月，Jessica Grose撰写了一篇文章，名为《课堂上的每一个技术工具都应该被无情地评估》。

AI让很多人获取知识变得更加方便容易，包括学生，但这并不是没有代价的。更加「因材施教」、「量身定制」的另一面，是让青少年失去学习的耐心和韧性的风险。

密歇根大学教育技术教授、《学习的技术：美国教育系统的研究、趋势和问题》一书的作者Mesut Duran表示，课堂上使用的许多技术并不是为学生而开发的。

「大多数技术最初都是为了商业目的而创建的，然后我们才决定如何在学校使用它们。」

有趣的是，这种描述非常符合GenAI的现状。谁能说OpenAI推出ChatGPT时有多少是考虑到在教育场景下的应用？

经过几周的对谈，文章作者Grose表达了这样的观点：

「我们需要彻底重新思考在课堂上评估和使用技术的方式；我希望看到的总体变化是，学校中的技术使用（设备和应用程序）应该由教育工作者驱动，而不是科技公司。」

参考资料：

https://www.ft.com/content/1f5c5377-5e85-4174-a54f-adc8f19fa5cb

https://www.washingtonpost.com/technology/2023/04/03/chatgpt-khanmigo-tutor-silicon-valley/

https://www.nytimes.com/2024/08/14/opinion/ai-schools-teachers-students.html

https://www.businessinsider.com/chatgpt-ai-tools-replace-teachers-high-school-students-learning-education-2024-8

ChatGPT 最强竞争对手 Claude 2 推出公开 Beta 版，我们上手实测了一把！

整理 | 屠敏

出品 | CSDN（ID：CSDNnews）

叮叮叮，又一款聊天机器人——Claude 2 来了，它可以编写代码、分析文本和撰写文章，当然也支持中文！

其实，Claude 2 的聊天机器和 OpenAI 也颇有渊源，因为它是 OpenAI 前高级成员 Daniela Amodei 和 Dario Amodei 在离职后创立的 Anthropic 公司开发的。

今年 3 月，创立仅 2 年的 Anthropic 便推出了 Claude 的初版，彼时在申请测试之后，有不少媒体直接将其定位为“ChatGPT 最强劲的竞争对手”。

为什么这么说？

从最新的 Claude 2 来看，用户可以直接通过 Anthropic 网站使用上 Claude 2，而不需要等待漫长的“候选名单”。不过，目前仅限美国和英国地区用户使用。

同时，需要花 20 美元付费购买 ChatGPT Plus 服务才能用上的一些功能，如上传文件自动总结 PDF 文档，可以在 Claude 2 上免费就能用上。

而且，Anthropic 声称 Claude 2 在三个关键领域展示了进步：编码、数学和推理。他们在博客中写道：“我们最新的模型在律师考试多项选择部分的得分为 76.5%，高于 Claude 1.3 的 73.0%。与申请研究生院的大学生相比，Claude 2 在 GRE 阅读和写作考试中的得分高于 90%，在定量推理方面与申请者的中位数类似。”

那么，Claude 2 和 ChatGPT 相比，真实能力究竟如何？是否能赶超 ChatGPT？CSDN 也在第一时间上手体验了一下！

自我介绍

话不多说，先让大家对它有个基础的了解：

常规聊天机器人有的能力，Claude 2 都有，而且正如上文所说，多了一个“查找并提取信息”的能力。

和 Google Bard 相比，至少 Claude 2 是支持中文的，不过在理解能力上还有一定的局限性。

稍微尖锐一些的话题，当问及 Claude 2 ，它和 ChatGPT 相比有何优势时，Claude 2 直白地拒绝做比较。同时，不知道是不是中文能力不太好，在回答问题的过程中出现了一些不明所以的数字内容。当问及它时，它也进行了解释，“数字就是一段无意义的数字串。”

编码

根据Anthropic官方表述，在编码能力方面，Claude 2 表现出熟练程度的提高。它在Python 编程测试 Codex HumanEval上的得分从 56% 上升到 71.2%。

先来一道简单的编码问题。

问：用 Python 实现冒泡排序

Claude 2 最终会对代码思路进一步讲解，方便即使不太精通代码的用户也能了解。

提问：

Claude 2：

#include

class Complex {

public:

double real;

double imag;

Complex(double real = 0.0, double imag = 0.0) {

this->real = real;

this->imag = imag;

}

// 复数加法

Complex operator+(const Complex& other) {

return Complex(real + other.real, imag + other.imag);

}

// 复数减法

Complex operator-(const Complex& other) {

return Complex(real - other.real, imag - other.imag);

}

// 复数乘法

Complex operator*(const Complex& other) {

return Complex(real*other.real - imag*other.imag,

real*other.imag + imag*other.real);

}

// 复数除法

Complex operator/(const Complex& other) {

double r = other.real;

double i = other.imag;

double denominator = r*r + i*i;

return Complex((real*r + imag*i)/denominator,

(imag*r - real*i)/denominator);

}

// 复数乘方

Complex pow(int exponent) {

double r = pow(abs(), exponent) * cos(exponent * arg());

double i = pow(abs(), exponent) * sin(exponent * arg());

return Complex(r, i);

}

// 复数取模

double abs() {

return sqrt(real*real + imag*imag);

}

// 复数辐角

double arg() {

return atan2(imag, real);

}

};

int main() {

Complex a(1.0, 2.0);

Complex b(3.0, 4.0);

Complex c = a + b;

Complex d = a - b;

Complex e = a * b;

Complex f = a / b;

Complex g = a.pow(2);

std::cout

return 0;

}

自动总结 PDF 文档

在查找并提取信息维度，我们通过上传一篇《Exploring Length Generalization in Large Language Models》的 PDF 论文，让其帮忙总结。

Claude 2 在响应速度和生成内容维度表现都不错，而且用中文提问，即使文档是全英文的论文，其生成的总结内容也是采用中文输出：

数学问题

同样，根据官方评测，Claude 2 在 GSM8k（一项包含小学数学问题的测试）上，它的得分从 85.2% 提高到 88%。

那我们便以经典的鸡兔同笼问题来检测一下 Claude 2 的能力。

有些出乎意料的是，Claude 2 给出的思路是对的，但是在计算时出现了错误。当告诉它“算错了”时，它也会及时明白错误，并在重新输出后给出了正确的答案：

再来一题：7 年前，妈妈年龄是儿子的6 倍，儿子今年 12 岁，妈妈今年多少岁?

这一次 Claude 2 没有出错。

再试试看：同学们进行广播操比赛，全班正好排成相等的6行。小红排在第二行，从头数，她站在第5个位置，从后数她站在第3个位置，这个班共有()人。

几轮下来，Claude 2 在小学数学能力表现方面还不错。

ChatGPT vs Claude 2

互为竞品，我们还让 ChatGPT 给 Claude 2 出了一道题：

Claude 2 很快给出了答案：

再让 ChatGPT 来评价一下：“非常棒的工作，Claude 2！它成功地解决了这道问题。”

闲聊

虽然 Claude 2 说自己的中文理解能力还有限制，但是我们还是忍不住地试了一下：

通过这个示例，Claude 2 表现让我们感到了惊喜。

再试一次：

还不错！

最后

整体而言，像 Claude 2 这样的人工智能模型可以分析长而复杂的作品，但 Anthropic 仍然意识到它的局限性。毕竟，语言模型有时会凭空捏造一些东西，也会像计算数学题一样出错。

而且整体体验下来，如果说其能力超过了 ChatGPT，其实还为时尚早。具体在使用时候，还是建议大家需要对输出内容自行验证，工具只能作为辅助。

最后，如果对 Claude 2 感兴趣的小伙伴，也可以通过：https://www.anthropic.com/index/claude-2 申请注册体验。

发布于：江苏

加入收藏打印本页关闭窗口返回顶部