不可发布违法信息,一旦发现永久封号,欢迎向我们举报!
百科|常识分享
分享各种百科|日常
18常识网 > 餐饮行业新闻资讯 > 百科|常识 >  ChatGPT成8岁娃导师,外国家长们慌了! ChatGPT 最强竞争对手 Claude 2 推出公开 Beta 版,我们上手实测了一把!


ChatGPT成8岁娃导师,外国家长们慌了! ChatGPT 最强竞争对手 Claude 2 推出公开 Beta 版,我们上手实测了一把!

发布时间:2024-09-02 09:53:03  来源:网络整理  浏览:   【】【】【

ChatGPT成8岁娃导师,外国家长们慌了! ChatGPT 最强竞争对手 Claude 2 推出公开 Beta 版,我们上手实测了一把! 

ChatGPT成8岁娃导师,外国家长们慌了!

新智元报道

编辑:乔杨 好困

【新智元导读】GenAI的这股风不知不觉也刮到了学校课堂中。根据外媒报道,美国、英国、韩国等地的中小学逐渐开始推行「AI教育变革」。为什么被一众大学禁止的ChatGPT类AI工具,反而要在中小学推广?

虽然OpenAI还没靠AI大模型真正实现盈利,GenAI已经迎来了一个坚实的用户群体——各国的中小学。

根据《金融时报》、《华盛顿邮报》、《纽约时报》等多家媒体的报道,已经有不止一个国家和地区计划在中小学课堂上使用AI辅助教学。

AI走入中小学课堂

伦敦的一所私立学校David Game College高中正在使用ChatGPT等人工智能工具取代教师,以帮助一些学生准备考试。

在这所学校9月开始的试点计划中,20名15岁左右的学生将在参加GCSE(中等教育通用证书,相当于高中文凭)考试之前使用人工智能工具一年,备考科目包括英语、数学、生物、化学和计算机科学。

除了AI工具,每名学生还将配备三名全职学习教练,以获得个性化的学习路径。

在AI技术氛围更浓厚的加州,甚至有年龄更小的孩子开始在学习过程中使用AI工具。

即使美国各地的学校都禁止使用ChaGPT,防止作弊或模型幻觉对学生造成长期伤害,可汗实验室学校依旧引入了与OpenAI合作开发的模型Khanmigo。

可汗实验室学校依旧是一所私立学校,每年的学费超过3.1万美元。由于地处硅谷,许多学生家长本就身处AI行业,学生们也对各种技术概念十分熟悉。

可汗学院创始人Salman Khan表示,「大多数家长对此都非常兴奋并能看到其中的力量,他们只是想要合理的护栏。」

8岁的Alisha Agrawal在人工智能导师Khanmigo的帮助下,在加州Palo Alto的可汗实验室学校进行课堂练习

以上的教育试验都只停留在个别的私立学校层面,而韩国的行为似乎更加激进,他们已经从教育部开始自上而下地在全国范围内引入由AI驱动的数字教科书。

韩国教育部长表示,有AI功能的平板电脑,是教育系统改革中的「关键」。这项技术由LG、三星等韩国公司开发,他们计划明年引入,面向年仅8岁的学生。

到2028年,除音乐、美术、体育和思想品德外,所有学科都将引入AI相关的app,教师可以通过数字仪表板监控学生的活动。

除了教科书,也将引入其他方面的AI工具,包括课堂对话的自动转录系统和回答学生提问的移动机器人。

与此同时,学生将接受数字素养方面的培训,以学会如何负责任地部署、使用使用AI工具。

对于这项改革计划,官方解释如下:

「我们都同意需要从单向的、以记忆为基础的课堂,转变为学生可以参与并掌控学习的空间。2025年是这一变革的关键节点,我们需要利用AI教科书来帮助教师转变课程模式。」

省钱省力,还能因材施教

为什么这么多国家的学校要争先恐后地在课堂中部署AI?仅仅是因为「时髦」吗?

在很多决策者看来,用AI辅助教学有诸多好处。首先是更好地促进「因材施教」,促进学生主动的创造性学习。

根据《金融时报》的分析,虽然韩国在OECD组织的对各国学生的评估测试中一直名列前茅,但首尔政府担心传统的以记忆为基础的学习方法正在扼杀创新,因此AI才成为了这场教育改革的关键。

根据韩国教育部的说法,他们将采用可定制平板电脑,AI软件可以根据每个学生的数据评估其学习水平和进度,分辨出「快速学习者」和「慢速学习者」,从而生成不同复杂程度的任务,为每个人提供量身定制的教育。

大量的韩国学生都会进行课下补习,导致同一课堂往往存在不同的进度——有些人因为学过觉得太简单因而昏昏欲睡,其他人则跟不上课程。

教育部官员表示,AI教科书可以解决这个问题:「因为它能为任何情况提供各种内容,激发学生的学习兴趣并帮助他们进行创造性思考。」

伦敦David Game College的校长John Dalton也表达了类似的看法。

班级的整体进度并不适用于每个人,而AI驱动的自适应学习将让学生受益匪浅。他们可以按照自己的节奏来,不必强求必须与整个班级保持一致。

Dalton表示,这种「因材施教」的方法可以大大提高教授核心科目的效率,学校可以利用剩余时间发展「素质教育」,比如关注学生的自我意识、批判性思维、积极的公民意识、数字素养、艺术表达、公共演讲和企业家精神等等。

参与试点的这20名学生就将在下午参加「多样化的辅助课程」,包括学习如何辩论、培养创业技能、探索AI和金融素养,并参与烹饪和绘画等创意活动。

此外,不同于和人类教师的互动,学生们可以放心大胆地向AI助手提出那些可能让教师感到不适的问题。即使学习速度缓慢或者犯错,也不必担心来自AI教师的评判。

让学生在一个安全的环境中按照自己的节奏学习,可以增强他们的自信心,在促进知识掌握的同时改善心理健康。

此外,Dalton补充说,引入AI教学并不代表完全排除人类教师的参与,「如果学生愿意,他们仍然可以和老师互动」。

除了这些直接优势外,一些教育工作者还看到了其他方面的价值。

他们认为,这可以帮助解决英格兰多年来面临的教师短缺和过度劳累问题。随着班级规模的不断扩大,教师和学生之间缺乏一对一互动的负面影响,或许也能用AI弥补。

家长不满,老师针锋相对

韩国教育部引入AI教科书的计划受到许多教师的欢迎。根据教师协会的统计,54%的公立学校教师表示支持。

然而,这个计划引起了许多家长的强烈反对,他们担心这会让孩子过度接触数字设备,以及受到AI给出的潜在错误信息的影响。

已经有超过5万名家长签署请愿书,要求政府更加关注学生的整体福祉,其中写道:「作为家长,因为孩子们接触数字设备,我们已经遇到了许多前所未有的问题。」

41岁的Lee Sun-young是两个学龄儿子的母亲,她表示,与AI教科书相比,她更希望看到更多的课后辅导老师来帮助学生。

「我担心,过多使用数字设备可能会对他们的大脑发育、注意力时长和解决问题的能力产生负面影响——他们已经过度使用智能手机和平板电脑了」。

首尔中央大学社会学教授Shin Kwang-Young也不认同这种改革措施,他表示,「政府过于仓促地推出AI教科书,而没有正确评估其副作用,只是因为人工智能是当今的大趋势」。

在课堂上使用AI技术会引来多方面的风险,考虑到虚假信息、剽窃和泄露学生个人信息的潜在可能性。课堂上的人工智能面临着「失控」的风险。

而在韩国教育部的计划中,并没有说明这类AI教育工具将如何运作,以及如何防止人工智能产生幻觉或错误的倾向。

Shin Kwang-young补充说,想要转变「死记硬背」的学习模式是合理的,但需要「适当地」改革教育系统,包括考试方法,而非一味寄希望于AI。

教育咨询公司Higher Learning Group总监Hadida Grabow的看法相对乐观一些,但她依旧认为AI无法取代高水平的人类教师,只能作为有价值的辅助工具。

虽然我们看到了一些「有前景的案例」,比如谷歌的Socratic和可汗学院的AI教学助手,但Grabow表示:「我们没有看到任何可以替代高质量教育者的东西。」

在可汗学院对Khanmigo的使用中,我们最无法忽视的,是AI可能给出的错误信息和幻觉。

在使用AI的过程中,教师们需要始终提醒学生「Khanmigo可能会犯错」、「需要始终仔细检查从Khanmigo那里获得的任何信息」。

此外,AI系统无法判断学生的语气或面部表情,而这些是「教学时判断学生是否理解的关键指标」。

泰晤士报的意见撰稿人Jessica Grose长期报道教育领域,今年以来她撰写了多篇有关在课堂上使用最新AI技术的报道。

采访了多名中学和大学教师关于AI的使用体验后,她的总体看法是:尽管在学校使用AI有一些实际的好处——比如更快地添加引用以及完成基本编码等机械任务——但缺点是显著的。

Leila Wheless从1991年开始进入教育行业,她尝试对中学的英语和语言艺术课堂使用AI保持「开放的心态」,但学生们使用AI的结果令人沮丧。

她给学生布置了研究「先知」的作业,结合AI进行搜索后,她的学生给出了这样的答案:「基督教先知摩西因去除T恤上的巧克力污渍而闻名。」

令Wheless更惊讶且难以理解的是,这名学生甚至没有想到问一问老师来求证这个荒谬的结果。

虽然AI会产生幻觉和谬误是几乎人尽皆知的事实,但八年级的学生似乎没有相关的背景知识,也缺少智识方面的耐性去质疑AI给出的答案。

这个案例让我们看到,使用AI最大的问题或许不在于作弊——毕竟学生们一直以来都在用各种工具尝试作弊——或者得到荒谬的错误答案。

更棘手的问题是,当学生将头脑风暴和写作外包给ChatGPT这样的GenAI工具时,他们可能正在失去批判性思考的能力,而且难以在完成艰难任务的过程中获得克服挫折感的能力。

在加州教授高中英语的Sarah Martin表示,比猖獗的作弊和学术不端更令她困扰的是,这些学生身上不再有任何「韧性」。

在她教书的七年中,学生们愿意花在挑战性任务上的时间变得越来越短。

以前,很多学生会花几天时间自我斗争尝试掌握一个概念。但现在,如果学生们无法在几分钟内理解,就可能直接放弃脑力方面的努力,寻找替代方案,无论是聊天机器人还是向朋友求助。

今年4月,Jessica Grose撰写了一篇文章,名为《课堂上的每一个技术工具都应该被无情地评估》。

AI让很多人获取知识变得更加方便容易,包括学生,但这并不是没有代价的。更加「因材施教」、「量身定制」的另一面,是让青少年失去学习的耐心和韧性的风险。

密歇根大学教育技术教授、《学习的技术:美国教育系统的研究、趋势和问题》一书的作者Mesut Duran表示,课堂上使用的许多技术并不是为学生而开发的。

「大多数技术最初都是为了商业目的而创建的,然后我们才决定如何在学校使用它们。」

有趣的是,这种描述非常符合GenAI的现状。谁能说OpenAI推出ChatGPT时有多少是考虑到在教育场景下的应用?

经过几周的对谈,文章作者Grose表达了这样的观点:

「我们需要彻底重新思考在课堂上评估和使用技术的方式;我希望看到的总体变化是,学校中的技术使用(设备和应用程序)应该由教育工作者驱动,而不是科技公司。」

参考资料:

https://www.ft.com/content/1f5c5377-5e85-4174-a54f-adc8f19fa5cb

https://www.washingtonpost.com/technology/2023/04/03/chatgpt-khanmigo-tutor-silicon-valley/

https://www.nytimes.com/2024/08/14/opinion/ai-schools-teachers-students.html

https://www.businessinsider.com/chatgpt-ai-tools-replace-teachers-high-school-students-learning-education-2024-8


ChatGPT 最强竞争对手 Claude 2 推出公开 Beta 版,我们上手实测了一把!

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

叮叮叮,又一款聊天机器人——Claude 2 来了,它可以编写代码、分析文本和撰写文章,当然也支持中文!

其实,Claude 2 的聊天机器和 OpenAI 也颇有渊源,因为它是 OpenAI 前高级成员 Daniela Amodei 和 Dario Amodei 在离职后创立的 Anthropic 公司开发的。

今年 3 月,创立仅 2 年的 Anthropic 便推出了 Claude 的初版,彼时在申请测试之后,有不少媒体直接将其定位为“ChatGPT 最强劲的竞争对手”。

为什么这么说?

从最新的 Claude 2 来看,用户可以直接通过 Anthropic 网站使用上 Claude 2,而不需要等待漫长的“候选名单”。不过,目前仅限美国和英国地区用户使用 。

同时,需要花 20 美元付费购买 ChatGPT Plus 服务才能用上的一些功能,如上传文件自动总结 PDF 文档,可以在 Claude 2 上免费就能用上。

而且,Anthropic 声称 Claude 2 在三个关键领域展示了进步:编码、数学和推理。他们在博客中写道:“我们最新的模型在律师考试多项选择部分的得分为 76.5%,高于 Claude 1.3 的 73.0%。与申请研究生院的大学生相比,Claude 2 在 GRE 阅读和写作考试中的得分高于 90%,在定量推理方面与申请者的中位数类似。”

那么,Claude 2 和 ChatGPT 相比,真实能力究竟如何?是否能赶超 ChatGPT?CSDN 也在第一时间上手体验了一下!

自我介绍

话不多说,先让大家对它有个基础的了解:

常规聊天机器人有的能力,Claude 2 都有,而且正如上文所说,多了一个“查找并提取信息”的能力。

和 Google Bard 相比,至少 Claude 2 是支持中文的,不过在理解能力上还有一定的局限性。

稍微尖锐一些的话题,当问及 Claude 2 ,它和 ChatGPT 相比有何优势时,Claude 2 直白地拒绝做比较。同时,不知道是不是中文能力不太好,在回答问题的过程中出现了一些不明所以的数字内容。当问及它时,它也进行了解释,“数字就是一段无意义的数字串。”

编码

根据Anthropic官方表述,在编码能力方面,Claude 2 表现出熟练程度的提高。它在Python 编程测试 Codex HumanEval上的得分从 56% 上升到 71.2%。

先来一道简单的编码问题。

问:用 Python 实现冒泡排序

Claude 2 最终会对代码思路进一步讲解,方便即使不太精通代码的用户也能了解。

提问:

Claude 2:

#include

#include

class Complex {

public:

double real;

double imag;

Complex(double real = 0.0, double imag = 0.0) {

this->real = real;

this->imag = imag;

}

// 复数加法

Complex operator+(const Complex& other) {

return Complex(real + other.real, imag + other.imag);

}

// 复数减法

Complex operator-(const Complex& other) {

return Complex(real - other.real, imag - other.imag);

}

// 复数乘法

Complex operator*(const Complex& other) {

return Complex(real*other.real - imag*other.imag,

real*other.imag + imag*other.real);

}

// 复数除法

Complex operator/(const Complex& other) {

double r = other.real;

double i = other.imag;

double denominator = r*r + i*i;

return Complex((real*r + imag*i)/denominator,

(imag*r - real*i)/denominator);

}

// 复数乘方

Complex pow(int exponent) {

double r = pow(abs(), exponent) * cos(exponent * arg());

double i = pow(abs(), exponent) * sin(exponent * arg());

return Complex(r, i);

}

// 复数取模

double abs() {

return sqrt(real*real + imag*imag);

}

// 复数辐角

double arg() {

return atan2(imag, real);

}

};

int main() {

Complex a(1.0, 2.0);

Complex b(3.0, 4.0);

Complex c = a + b;

Complex d = a - b;

Complex e = a * b;

Complex f = a / b;

Complex g = a.pow(2);

std::cout

std::cout

std::cout

std::cout

std::cout

return 0;

}

自动总结 PDF 文档

在查找并提取信息维度,我们通过上传一篇《Exploring Length Generalization in Large Language Models》的 PDF 论文,让其帮忙总结。

Claude 2 在响应速度和生成内容维度表现都不错,而且用中文提问,即使文档是全英文的论文,其生成的总结内容也是采用中文输出:

数学问题

同样,根据官方评测,Claude 2 在 GSM8k(一项包含小学数学问题的测试)上,它的得分从 85.2% 提高到 88%。

那我们便以经典的鸡兔同笼问题来检测一下 Claude 2 的能力。

有些出乎意料的是,Claude 2 给出的思路是对的,但是在计算时出现了错误。当告诉它“算错了”时,它也会及时明白错误,并在重新输出后给出了正确的答案:

再来一题:7 年前,妈妈年龄是儿子的6 倍,儿子今年 12 岁,妈妈今年多少岁?

这一次 Claude 2 没有出错。

再试试看:同学们进行广播操比赛,全班正好排成相等的6行。小红排在第二行,从头数,她站在第5个位置,从后数她站在第3个位置,这个班共有()人。

几轮下来,Claude 2 在小学数学能力表现方面还不错。

ChatGPT vs Claude 2

互为竞品,我们还让 ChatGPT 给 Claude 2 出了一道题:

Claude 2 很快给出了答案:

再让 ChatGPT 来评价一下:“非常棒的工作,Claude 2!它成功地解决了这道问题。”

闲聊

虽然 Claude 2 说自己的中文理解能力还有限制,但是我们还是忍不住地试了一下:

通过这个示例,Claude 2 表现让我们感到了惊喜。

再试一次:

还不错!

最后

整体而言,像 Claude 2 这样的人工智能模型可以分析长而复杂的作品,但 Anthropic 仍然意识到它的局限性。毕竟,语言模型有时会凭空捏造一些东西,也会像计算数学题一样出错。

而且整体体验下来,如果说其能力超过了 ChatGPT,其实还为时尚早。具体在使用时候,还是建议大家需要对输出内容自行验证,工具只能作为辅助。

最后,如果对 Claude 2 感兴趣的小伙伴,也可以通过:https://www.anthropic.com/index/claude-2 申请注册体验。

发布于:江苏

热门阅读排行

会员最新动态

实力展示

  • 鞋子信息
  • 常识知识
  • 各种信息百科
  • 信息发布
  • © 18常识网