行业新闻

宣布Openai的野心：让AI为您做所有事情

作者: bet356官网首页点击次数: 发布时间: 2025-08-04 09:15

亨特·莱特曼（Hunter Letterman）于2022年加入Openai后不久，他看到他的同事们推出了一个Chatgpt，该产品继续成为历史上增长最快的产品之一。同时，莱特曼（Letterman）悄悄地在一个团队中工作，专注于教授OpenAI模型来解决高中数学竞赛问题。如今，该团队称为Mathgen，被视为该计划的主要力量，导致Openai行业生成AI推理模型，AI推理模型是AI代理的主要技术，他们可以完成像人类这样的计算机上的活动。莱特曼在描述Mathgen的早期作品时告诉TechCrunch：“我们试图使数学推理模型更好，因为它们仍然很弱。” Ang Openai模型今天远非完美 - 该公司的最新AI系统仍然具有幻觉，并且在与复杂的任务交谈时，其代理商也不在意。但是最先进的模型在推理方面取得了重大发展。来自Openai的模型最近WO在国际数学奥林匹克运动会上获得金牌，这是一项针对世界上最聪明的高中学生的数学竞赛。 Openai认为，这些能力将转移到其他学科，最终使公司令人垂涎的环球代理人。 Chatgpt的诞生集中在意外的研究预览中，该预览在一家级消费者的商业中意外变得流行和开发，但Openai Agency是该公司在以前的TA Taon上仔细努力的结果。 Openai Ultraman的首席执行官告诉该公司在2023年的就职开发商说：“最后，您只需要询问计算机，它将为您完成所有这些任务。”这些功能通常被称为AI领域的代理。它带来的好处将是压倒性的。” 如果这些代理商能够意识到超人的愿景还有待观察，但是Openai在2024年秋天推出了第一届AI推理模型O1时使世界感到惊讶。不到一年后，21导致这一突破的主要研究人员已成为硅谷最热门的人才。马克·扎克伯格（Mark Zuckerberg）已将参与O1开发项目的五名研究人员加入了新成立的超级智能元部门，并提供了超过1亿美元的薪酬选择。其中一位是Zhaoshengjia，最近被任命为Meta超级智能实验室的首席科学家。加固研究的复兴越来越多的OpenAI推断和代理模型与称为强化学习（RL）的机械训练方法密切相关。在环境模拟中研究AI模型的AI模型是否是正确的选择。数十年来，对加固进行了研究。例如，2016年，大约在2015年Openai成立的大约一年后，由Alphago创建的AI系统Google DeepMind使用强化研究，在GO比赛中击败了世界冠军行动全球关注。大约在那个时候，OpenAI的第一批员工Andre Kapasi开始考虑如何使用强化研究来创建可以使用计算机的AI代理。但是开发了几年的OpenAI才能开发必要的模型和培训技术。到2018年，OpenAI是GPT家族的第一个推出了第一个大型语言模型，该模型以前曾接受过大量互联网数据和大型GPU集群的培训。 GPT模型在文本处理方面表现良好，最终是出生于ChatGpt的，但是基本数学存在缺点。直到2023年，Openai才取得了突破，最初名为“ Q*”，后来更名为“草莓”。通过合并大型语言模型，增强研究和一种称为测试时间计算的技术来实现这一突破。迟到使模型额外的计算时间和力量在给出答案之前，请在计划和解决问题的情况下验证和验证每个步骤。它允许Openai介绍一种称为“思想章节”（COT）的新方法，该方法在处理看不见的数学问题时改善了AI的性能。埃尔·基希基（El Kishki）说：“我看到模型开始推理。” “它会看到错误并回来，也会'失败'。这就像读某人的想法。” 尽管这些技术本身并不是一部小说，但它们是独特的结合来创建草莓，这直接有助于O1的形成。 Openai很快意识到，AI推理模型的计划和现实 - 分析能力可用于增强AI代理的能力。莱特曼说：“我们解决了我多年来一直在想的问题。” “这是我研究生涯中最激烈的时刻之一。” 扩展推理的能力在AI识别模型中，OpenAI识别了可以用于改善AI模型的两个新方向：在AI模型的晚期培训中使用更多的计算能力，并为AI模型提供更多的时间和电源处理回答问题。莱特曼说：“作为一家公司，Openai不仅专注于事物的现状，而且还关注它们的衡量方式。” 两位消息人士告诉TechCrunch，在2023年的草莓崩溃后不久，Openai组成了一个由研究人员Daniel Selsam领导的“代理”团队，以进一步发展。尽管该团队被称为“代理人”，但最初并未像我们今天想的那样区分PAG -Iintinno代理商的模型。该公司只希望AI系统完成复杂的任务。后来，由塞尔萨姆（Selsam）领导的代理团队的工作已成为由OpenAI联合创始人Ilya Sarzkefer，首席研究官Mark Chen和首席科学家Jacob Pachoki领导的更大的OpenAI模型开发项目的一部分。 Openai应该投资基本资源（主要是人才和GPU）来构建O1。在整个OpenAI的历史中，研究人员将需要咨询公司的领导才能获得资源，并且展示突破是一种可靠的方式确保访问资源。莱特曼说：“ OpenAI的主要特征之一是研究中的所有内容都在下面。” “当我们证明证据（O1）时，该公司表示'理性，继续推动'。” 一些前雇员说，产生通用人工智能（AAGI）的起点是在AI模型中取得成功的主要因素。通过专注于使用AI模型而不是产品来开发尽可能智能的智能，OpenAI可以将O1置于其他工作之上。而且，凭借具有竞争激烈的AI实验室，对这种想法的如此巨大的投资并非总是可能的。事实证明，尝试新培训方法的决定是有先见之明的。到2024年底，许多顶级AI实验室开始发现，使用传统的预训练扩展创建的模型减少了回报。如今，AI领域中的大多数驱动力都来自识别模型的促进。 AI的“推理”是什么？在许多方面，AI研究的目的是复制Human智能计算机。自O1推出以来，ChatGPT用户体验已经充满了更类似人类的功能，例如“思考”和“推理”。当被问及Openai的模型是否真的是推断时，El Kishki坚持认为，他从计算机科学的角度看了看概念。埃尔·基希基（El Kishki）说：“我们教授如何很好地消费计算资源以获取答案。因此，如果您从这个角度定义它，是的，这是合理的。” 莱特曼更关心模型结果，而不是与人脑的方式或关系。莱特曼说：“如果该模型正在做一些困难的事情，那就可以做到任何估计的推理。” “我们可以笑，这是一个原因，因为它看起来像是轨迹的这些信息，但是它们都为许多人真正强大而有用的AI工具创造了一种替代方案。” Openai研究人员已经教导说，人们可能不同意其命名或推理的含义 - 课程E，批评家出现 - 但他们认为这不如其模型的功能重要。其他AI研究人员倾向于提出它。非营利组织AI2的AI研究人员内森·兰伯特（Nathan Lambert）正在与飞机进行比较的博客文章中对AI的推理进行建模。他说，这两种综合系统都受到人类推理和鸟类飞行的启发性，但它们通过完全不同的机制运行。来自OpenAI，Anthropic和Google DeepMind的一群AI研究人员提出了一个最近的角色，人们了解AI推断模型现在还不够深，需要进行更多的研究。现在断言这些模型中正在发生的事情还为时过早。下一个前沿：主题活动的AI代理当今市场上的AI代理在定义明确，经过验证的区域（例如编码）中表现最佳。 Openai Codex Agent旨在帮助软件工程师在编码时共享简单的任务。同时，人类模型在AI编码工具（例如光标和Claude Code）中特别受欢迎，这是愿意使用付费的AIS AII ADENTENT。但是，当与人们想要自动化的许多复杂，主观的活动交谈时，AI的总体进球代理（例如Openai的Chatgpt Agent和Peclexity的彗星）不在路上。我发现，当我试图将这些工具用于在线购物或寻找长期停车时，这些代理商比我预期的要长，并犯了一些愚蠢的错误。当被问及代理商在主观任务方面的局限性时，莱特曼说：“由于许多机器研究问题，这是一个数据问题。现在，一些研究对我来说真的很兴奋，现在试图找到较少证明的方法。我们有一些有关如何做这些事情的提示。” Openairesearcher Norm Brown，他在奥运会和O1中帮助创建了国际数学模型告诉TechCrunch，OpenAI拥有新的一般刺激技术，使他们可以教授不容易证明的AI模型。他说，这样一来，该公司就建立了一个在国际数学奥林匹克运动会上赢得金牌的模型。 OpenAI的国际数学奥林匹克模型是一种较新的AI系统，它会生成许多代理商，然后同时探索许多想法，然后选择最佳答案。这样的AI模型变得流行； Google和XAI最近使用此技术发布了最先进的模型。布朗说：“我认为这些模型将更具数学能力，并且能够在球迷的其他领域更有能力。”我没有理由认为这很慢。 “ 这些技术可以帮助提高OpenAI模型的性能，这些进步可能是该公司即将推出的GPT-5模型。 Openai希望通过推出GPT-5将其优势与竞争对手结合起来，完美的开发人员和消费者是最好的AI模型Rive代理商。但是该公司还希望使其产品更易于使用。 El Kishki说，OpenAI希望开发一个可以直观地了解用户需求的AI代理，而无需选择特定设置的用户。他说，OpenAI的目的是开发这样的AI系统：知道何时调用特定工具以及需要很长时间的Lightor。这些想法描绘了Chatgpt的最终版本的图片：可以在互联网上为您做任何事情并了解您想如何做的代理。这与当今的Chatgpt有些不同，但是公司的研究一直在朝这个方向发展。尽管Openai无疑是几年前领导的AI行业，但该公司现在面临着许多强大的竞争对手。问题不仅是Openai可以实现未来的代理人，还可以在Google，Anthropic，XAI或Meta之前做到这一点吗？金融的官方帐户 24小时广播滚动最新的财务和视频信息并扫描QR码以供更多粉丝遵循（Sinafinance）

上一篇：摩根大通首席经济学家朱·希宾（Zhu Hibin）离开了下一篇：没有了

行业新闻

宣布Openai的野心：让AI为您做所有事情

相关新闻

新闻中心

新闻中心

beat365体育官网