行业新闻
宣布Openai的野心:让AI为您做所有事情
作者: bet356官网首页 点击次数: 发布时间: 2025-08-04 09:15
亨特·莱特曼(Hunter Letterman)于2022年加入Openai后不久,他看到他的同事们推出了一个Chatgpt,该产品继续成为历史上增长最快的产品之一。同时,莱特曼(Letterman)悄悄地在一个团队中工作,专注于教授OpenAI模型来解决高中数学竞赛问题。 如今,该团队称为Mathgen,被视为该计划的主要力量,导致Openai行业生成AI推理模型,AI推理模型是AI代理的主要技术,他们可以完成像人类这样的计算机上的活动。 莱特曼在描述Mathgen的早期作品时告诉TechCrunch:“我们试图使数学推理模型更好,因为它们仍然很弱。” Ang Openai模型今天远非完美 - 该公司的最新AI系统仍然具有幻觉,并且在与复杂的任务交谈时,其代理商也不在意。 但是最先进的模型在推理方面取得了重大发展。来自Openai的模型最近WO在国际数学奥林匹克运动会上获得金牌,这是一项针对世界上最聪明的高中学生的数学竞赛。 Openai认为,这些能力将转移到其他学科,最终使公司令人垂涎的环球代理人。 Chatgpt的诞生集中在意外的研究预览中,该预览在一家级消费者的商业中意外变得流行和开发,但Openai Agency是该公司在以前的TA Taon上仔细努力的结果。 Openai Ultraman的首席执行官告诉该公司在2023年的就职开发商说:“最后,您只需要询问计算机,它将为您完成所有这些任务。”这些功能通常被称为AI领域的代理。它带来的好处将是压倒性的。” 如果这些代理商能够意识到超人的愿景还有待观察,但是Openai在2024年秋天推出了第一届AI推理模型O1时使世界感到惊讶。不到一年后,21导致这一突破的主要研究人员已成为硅谷最热门的人才。 马克·扎克伯格(Mark Zuckerberg)已将参与O1开发项目的五名研究人员加入了新成立的超级智能元部门,并提供了超过1亿美元的薪酬选择。其中一位是Zhaoshengjia,最近被任命为Meta超级智能实验室的首席科学家。 加固研究的复兴 越来越多的OpenAI推断和代理模型与称为强化学习(RL)的机械训练方法密切相关。在环境模拟中研究AI模型的AI模型是否是正确的选择。 数十年来,对加固进行了研究。例如,2016年,大约在2015年Openai成立的大约一年后,由Alphago创建的AI系统Google DeepMind使用强化研究,在GO比赛中击败了世界冠军行动全球关注。 大约在那个时候,OpenAI的第一批员工Andre Kapasi开始考虑如何使用强化研究来创建可以使用计算机的AI代理。但是开发了几年的OpenAI才能开发必要的模型和培训技术。 到2018年,OpenAI是GPT家族的第一个推出了第一个大型语言模型,该模型以前曾接受过大量互联网数据和大型GPU集群的培训。 GPT模型在文本处理方面表现良好,最终是出生于ChatGpt的,但是基本数学存在缺点。 直到2023年,Openai才取得了突破,最初名为“ Q*”,后来更名为“草莓”。通过合并大型语言模型,增强研究和一种称为测试时间计算的技术来实现这一突破。迟到使模型额外的计算时间和力量在给出答案之前,请在计划和解决问题的情况下验证和验证每个步骤。 它允许Openai介绍一种称为“思想章节”(COT)的新方法,该方法在处理看不见的数学问题时改善了AI的性能。 埃尔·基希基(El Kishki)说:“我看到模型开始推理。” “它会看到错误并回来,也会'失败'。这就像读某人的想法。” 尽管这些技术本身并不是一部小说,但它们是独特的结合来创建草莓,这直接有助于O1的形成。 Openai很快意识到,AI推理模型的计划和现实 - 分析能力可用于增强AI代理的能力。 莱特曼说:“我们解决了我多年来一直在想的问题。” “这是我研究生涯中最激烈的时刻之一。” 扩展推理的能力 在AI识别模型中,OpenAI识别了可以用于改善AI模型的两个新方向:在AI模型的晚期培训中使用更多的计算能力,并为AI模型提供更多的时间和电源处理回答问题。 莱特曼说:“作为一家公司,Openai不仅专注于事物的现状,而且还关注它们的衡量方式。” 两位消息人士告诉TechCrunch,在2023年的草莓崩溃后不久,Openai组成了一个由研究人员Daniel Selsam领导的“代理”团队,以进一步发展。尽管该团队被称为“代理人”,但最初并未像我们今天想的那样区分PAG -Iintinno代理商的模型。该公司只希望AI系统完成复杂的任务。后来,由塞尔萨姆(Selsam)领导的代理团队的工作已成为由OpenAI联合创始人Ilya Sarzkefer,首席研究官Mark Chen和首席科学家Jacob Pachoki领导的更大的OpenAI模型开发项目的一部分。 Openai应该投资基本资源(主要是人才和GPU)来构建O1。在整个OpenAI的历史中,研究人员将需要咨询公司的领导才能获得资源,并且展示突破是一种可靠的方式确保访问资源。 莱特曼说:“ OpenAI的主要特征之一是研究中的所有内容都在下面。” “当我们证明证据(O1)时,该公司表示'理性,继续推动'。” 一些前雇员说,产生通用人工智能(AAGI)的起点是在AI模型中取得成功的主要因素。通过专注于使用AI模型而不是产品来开发尽可能智能的智能,OpenAI可以将O1置于其他工作之上。而且,凭借具有竞争激烈的AI实验室,对这种想法的如此巨大的投资并非总是可能的。 事实证明,尝试新培训方法的决定是有先见之明的。到2024年底,许多顶级AI实验室开始发现,使用传统的预训练扩展创建的模型减少了回报。如今,AI领域中的大多数驱动力都来自识别模型的促进。 AI的“推理”是什么? 在许多方面,AI研究的目的是复制Human智能计算机。自O1推出以来,ChatGPT用户体验已经充满了更类似人类的功能,例如“思考”和“推理”。 当被问及Openai的模型是否真的是推断时,El Kishki坚持认为,他从计算机科学的角度看了看概念。 埃尔·基希基(El Kishki)说:“我们教授如何很好地消费计算资源以获取答案。因此,如果您从这个角度定义它,是的,这是合理的。” 莱特曼更关心模型结果,而不是与人脑的方式或关系。 莱特曼说:“如果该模型正在做一些困难的事情,那就可以做到任何估计的推理。” “我们可以笑,这是一个原因,因为它看起来像是轨迹的这些信息,但是它们都为许多人真正强大而有用的AI工具创造了一种替代方案。” Openai研究人员已经教导说,人们可能不同意其命名或推理的含义 - 课程E,批评家出现 - 但他们认为这不如其模型的功能重要。其他AI研究人员倾向于提出它。 非营利组织AI2的AI研究人员内森·兰伯特(Nathan Lambert)正在与飞机进行比较的博客文章中对AI的推理进行建模。他说,这两种综合系统都受到人类推理和鸟类飞行的启发性,但它们通过完全不同的机制运行。 来自OpenAI,Anthropic和Google DeepMind的一群AI研究人员提出了一个最近的角色,人们了解AI推断模型现在还不够深,需要进行更多的研究。现在断言这些模型中正在发生的事情还为时过早。 下一个前沿:主题活动的AI代理 当今市场上的AI代理在定义明确,经过验证的区域(例如编码)中表现最佳。 Openai Codex Agent旨在帮助软件工程师在编码时共享简单的任务。同时,人类模型在AI编码工具(例如光标和Claude Code)中特别受欢迎,这是愿意使用付费的AIS AII ADENTENT。 但是,当与人们想要自动化的许多复杂,主观的活动交谈时,AI的总体进球代理(例如Openai的Chatgpt Agent和Peclexity的彗星)不在路上。我发现,当我试图将这些工具用于在线购物或寻找长期停车时,这些代理商比我预期的要长,并犯了一些愚蠢的错误。 当被问及代理商在主观任务方面的局限性时,莱特曼说:“由于许多机器研究问题,这是一个数据问题。现在,一些研究对我来说真的很兴奋,现在试图找到较少证明的方法。我们有一些有关如何做这些事情的提示。” Openairesearcher Norm Brown,他在奥运会和O1中帮助创建了国际数学模型告诉TechCrunch,OpenAI拥有新的一般刺激技术,使他们可以教授不容易证明的AI模型。他说,这样一来,该公司就建立了一个在国际数学奥林匹克运动会上赢得金牌的模型。 OpenAI的国际数学奥林匹克模型是一种较新的AI系统,它会生成许多代理商,然后同时探索许多想法,然后选择最佳答案。这样的AI模型变得流行; Google和XAI最近使用此技术发布了最先进的模型。 布朗说:“我认为这些模型将更具数学能力,并且能够在球迷的其他领域更有能力。”我没有理由认为这很慢。 “ 这些技术可以帮助提高OpenAI模型的性能,这些进步可能是该公司即将推出的GPT-5模型。 Openai希望通过推出GPT-5将其优势与竞争对手结合起来,完美的开发人员和消费者是最好的AI模型Rive代理商。 但是该公司还希望使其产品更易于使用。 El Kishki说,OpenAI希望开发一个可以直观地了解用户需求的AI代理,而无需选择特定设置的用户。他说,OpenAI的目的是开发这样的AI系统:知道何时调用特定工具以及需要很长时间的Lightor。 这些想法描绘了Chatgpt的最终版本的图片:可以在互联网上为您做任何事情并了解您想如何做的代理。这与当今的Chatgpt有些不同,但是公司的研究一直在朝这个方向发展。 尽管Openai无疑是几年前领导的AI行业,但该公司现在面临着许多强大的竞争对手。问题不仅是Openai可以实现未来的代理人,还可以在Google,Anthropic,XAI或Meta之前做到这一点吗? 金融的官方帐户 24小时广播滚动最新的财务和视频信息并扫描QR码以供更多粉丝遵循(Sinafinance) 上一篇:摩根大通首席经济学家朱·希宾(Zhu Hibin)离开了 下一篇:没有了