n124906

标签: chatgpt

【最新的ChatGPT应该达到“博士级”智能水平,但它甚至无法标注地图】(C

【最新的ChatGPT应该达到“博士级”智能水平,但它甚至无法标注地图】(C

【最新的ChatGPT应该达到“博士级”智能水平,但它甚至无法标注地图】(CNN)人工智能炒作大师山姆·阿尔特曼(SamAltman)如今陷入了危机公关模式。OpenAI备受瞩目的ChatGPT机器人的最新版本本应达到“博士级别”的智能水平。它本应是该公司的一大飞跃,毕竟投资者已经向该公司投入了数十亿美元。然而,ChatGPT却呈现出更平淡、更简短的人格特质,无法可靠地回答一些基本问题。由此引发的公众嘲笑迫使该公司不得不做出尴尬的道歉,同时仍然坚持其对机器人能力的夸大其词。简而言之:它是个失败品。关于这个名为GPT-5的模型的失误,有几点值得注意。1.它凸显了生成式人工智能诸多现存的不足之处,这些不足之处很快就被批评者抓住了(稍后会详细说说,因为这些内容相当有趣)。2.它引发了人们对OpenAI打造和销售人类愿意付费的消费产品能力的严重怀疑。对于投资者来说,这尤其令人担忧,因为OpenAI从未盈利,据报道其估值却高达5000亿美元。让我们回到上周四,当时OpenAI终于向世界推出了GPT-5——据《华尔街日报》报道,比原计划晚了大约一年。这个行业的长处之一就是炒作,而在这方面,首席执行官山姆·阿尔特曼(SamAltman)做到了。在上周四发布前的直播中,阿尔特曼表示,与GPT-5交流就如同与“任何你需要的领域的真正博士级专家”交流一样。阿尔特曼一如既往地以高调的风格表示,GPT-5让他想起了“iPhone从那些大像素的老款机型到视网膜显示屏的转变”。他说,新模型在明显和微妙的方面都有显著提升,“感觉像是我再也不想回到过去的东西。”阿尔特曼在新闻发布会上表示。然而,当人们真正开始使用它时,情况就变了。用户们纷纷测试GPT-5,并对其荒谬的答案进行嘲笑。记者蒂姆·伯克(TimBurke)在Bluesky上表示,他让GPT-5“给我展示一幅美国前12任总统的图表,上面有他们的面部图像以及图像下方的名字”。然而,机器人却返回了一张只有9个人的图像,还创造性地拼错了美国早期领导人的名字,比如“GeargeWashingion”和“WilliamHenryHarrtson”。对于要求列出最近12任总统的类似提示,GPT-5返回的图像中出现了两个乔治·W·布什(GeorgeW.Bush)的版本。不,不是乔治·H·W·布什(GeorgeH.W.Bush)和小布什,而是“GeorgeH.Bush”,并且他的儿子出现了两次。不过第二次出现时,小乔治看起来只是个普通路人。GPT-5在标注美国基本地图时也遇到了困难,但正如科技作家埃德·齐特龙(EdZitron)在Bluesky上的帖子所展示的那样,这确实很有趣。周三,我要求GPT-5给我一张美国地图时,它的表现稍好一些。有些人确实可以在没有博士学位的情况下正确标注佛蒙特州,但GPT-5却做不到。这是我第一次听说“Yirginia”这个州名。当只有我们这些技术爱好者试图找出GPT-5的弱点时,它所犯的错误看起来很有趣。但一些ChatGPT的普通用户却笑不出来。尤其是因为用户们对新版本的人格特质——或者更准确地说,缺乏人格特质——感到特别不安。在推出新模型时,OpenAI实际上淘汰了其早期模型,包括已经上市一年多且广受欢迎的GPT-4o,这使得即使是喜欢聊天机器人早期版本的人突然也无法使用它了。超过4000人在Change.org上签名请愿,要求OpenAI恢复该版本。“我受够了ChatGPT5,”一位用户在Reddit上写道,解释说他试图使用新模型运行一个“简单系统”,而早期的ChatGPT模型曾经能够处理这些任务。该用户表示,GPT-5“失控了”,删除了任务并更改了截止日期。尽管OpenAI的支持者可能会将这归咎于个别事件甚至捏造的事件,但在GPT-5发布后的24小时内,阿尔特曼就陷入了危机公关,似乎对糟糕的反响感到措手不及。他在X上宣布了一系列更新措施,包括为付费订阅者恢复GPT-4o。“我们预计在一次性推出这么多东西时会有一些颠簸,”阿尔特曼在帖子中表示,“但情况比我们希望的更糟糕!”首席执行官未能预见公众的愤怒表明,他对大约7亿每周活跃用户如何使用其产品的了解并不深入。也许阿尔特曼错过了所有关于人们与ChatGPT或竞争对手聊天机器人形成深厚情感联系的报道——这些报道来自CNN、《纽约时报》和《华尔街日报》,人们仿佛与这些机器人进行着无尽的对话,仿佛它们是真人一样。在Reddit上简单搜索一下就能了解其他人如何将这个工具融入到他们的工作流程和生活中。基本的市场调研本应让OpenAI明白,大规模更新并淘汰人们依赖的工具,其后果将不仅仅是“有点颠簸”。当被问及对GPT-5的反弹时,OpenAI的一位代表将CNN指向阿尔特曼在社交媒体上的公开声明,这些声明宣布恢复旧版本,以及一篇关于该公司如何优化GPT-5的博客文章。混乱的推出过程反映出整个人工智能行业都在努力证明自己是消费产品的生产者,而不是他们喜欢称呼自己的“实验室”——因为这种称呼听起来更科学,也转移了人们的注意力,让人们忽视了一个事实,即他们背后有投资者试图为自己赚取巨额财富。人工智能公司通常会围绕模型在各种幕后基准测试中的表现大做文章,这些测试展示了机器人在复杂数学计算方面的能力。就我们所知,GPT-5可能在这些评估中表现出色。但问题是,OpenAI把炒作推向了平流层,失望本应(或本该)是不可避免的。“我真没想到OpenAI会在这么平庸的东西上砸了自己的招牌,”著名研究员、人工智能批评家加里·马库斯(GaryMarcus)写道,“在一个理性的世界里,他们的估值应该会受到影响,”他补充说,OpenAI尚未盈利,正在降低价格以维持用户数量,并且随着竞争加剧,人才也在大量流失。对于像马库斯这样的批评家来说,GPT-5的失败是一种证明。正如他在博客中指出的那样,埃隆·马斯克(ElonMusk)的Grok等其他模型的表现也不尽如人意,即使是人工智能的支持者也发出了反对的声音,这似乎是一个转折点。当人们谈论人工智能时,他们通常在谈论两件事之一:我们现在拥有的人工智能——具有有限、明确用途的聊天机器人——以及像阿尔特曼这样的公司声称他们能够打造的人工智能——能够超越人类智慧的机器,能够告诉我们如何治愈癌症、解决全球变暖、驾驶我们的汽车、种植我们的庄稼,同时在这一过程中娱乐并取悦我们。然而,随着每一个新模型的推出,人工智能的承诺与现实之间的差距似乎越来越大。
2025年8月11日,邓紫棋在播客中透露,她2019年通过信徒圈层引荐,机缘巧合

2025年8月11日,邓紫棋在播客中透露,她2019年通过信徒圈层引荐,机缘巧合

2025年8月11日,邓紫棋在播客中透露,她2019年通过信徒圈层引荐,机缘巧合下投资了一家AI公司,在ChatGPT爆红前完成布局。如今该项目已带来十倍回报,且自2017年起她投资的3家科技公司均实现盈利,展现精准投资眼光。邓紫棋乐队邓紫棋门票邓紫棋北京巡演邓紫棋国外巡演
高盛:人形机器人的“ChatGPT时刻”快到了2025年世界机器人大会(WRC

高盛:人形机器人的“ChatGPT时刻”快到了2025年世界机器人大会(WRC

高盛:人形机器人的“ChatGPT时刻”快到了2025年世界机器人大会(WRC)在8月8-12日在北京亦庄举办。北京从2015年起办了10次了,永久会址,现在影响力真做起来了,人形机器人的发展大大扩张了影响力。上海的WAIC(世界人工智能大会)影响力也很大,但WRC专注于机器人。高盛的人跑来参观,与一些人形机器人公司的高管交谈。总体共识是这些机器人的“ChatGPT时刻”已经不远了。股市方面,中国人形机器人指数一年翻倍还多。高盛引用了王兴兴的观点,人形机器人进入现实世界的技术拐点还需要2到3年(不会是十年)。活动中至少推出了20款新型人形机器人。以下是其主要观点:1.与2025年上海WAIC相比,我们在活动中观察到的家庭/消费者游客流量非常强劲。后者更专注于以人形机器人为子集的广泛的人工智能学术和行业发展主题,因此拥有更多的专业参观者,而WRC则完全致力于机器人技术和产品演示。我们认为,这表明近期教育、伴侣和娱乐需求潜力可能很大(除了科学研究、人工智能模型训练、政府、开发商和舞台表演需求等)。从长远来看,我们认为这是一个早期指标,表明只要机器人产品足够有用、价格合理且足够安全,除了制造需求之外,消费者的需求潜力可能非常巨大。最近,Unitree推出了售价39,900元(121cm/25kg/26DOF)的新产品R1,Engine.ai宣布计划很快以38,500元的价格推出SA02(125cm/25kg/26+2DOF),这两者都可能以更简化的产品规格来满足这些需求。2.关于技术拐点,我们听到的最积极的评论表明,至少还需要1-2年的时间来扩大数据规模并增强强化学习(RL)的模型,或者在基于规则的作1-2年后过渡到端到端作。根据一些评论,这主要是因为工业环境难以模拟,可能需要高达70-80%的高质量真实世界数据才能进行有效训练。我们还听说了人类作为桥梁解决方案的多模式远程作等做法,前提是可以确保低延迟(两家公司引用了特斯拉在洛杉矶的新餐厅,在那里观察到Optimus机器人正在提供爆米花)。在开幕式上的演讲中,宇树CEO王兴兴将机器人的“ChatGPT时刻”定义为实际上能够在全新的环境中以通用技能完成任务,他表示,这至少还需要2-3年的时间,但不会超过10年的时间。也就是说,谷歌于2025年5月推出的新AI视频生成模型Veo3特别擅长创建和整合音频(包括对话、音效和背景音乐),并且从文本和图像提示到现实世界的物理和准确的口型同步都表现出色,在机器人公司之间提出了一个有趣的讨论点。它的功能引发了一个问题,即其底层人工智能架构是否比视觉-语言-行动(VLA)模型与强化学习(RL)相结合更加优化,自今年年初以来,一些人一直将其视为机器人和具身人工智能的主要人工智能解决方案。因此,我们强调,鉴于软件和硬件结构之间持续、快速的共同演变,投资者应该意识到潜在的产品重新设计风险,因为这两个要素在人工智能开发中仍然有着内在的联系。然而,我们很高兴看到该行业的快速进步,每隔几个月就会出现新的进步。顺便说一句,Nvidia在WRC上非常积极主动,发表主题演讲/研讨会并展示其在物理人工智能和通用机器人方面的战略举措,其全栈套件包括云规模模型训练、基于物理的模拟(例如IsaacSim/Lab)用于合成数据生成,以及实时边缘AI部署(例如JetsonAGXThor)。他们最近还新推出了CosmosReason,这是一种先进的视觉语言模型(VLM),旨在为机器人灌输常识和理解现实场景的能力。值得注意的是,根据我们的检查,几乎每个机器人产品仍在使用JetsonAGXThor或更广泛的Jetson平台。3.在本次活动期间(7月/8月),共有~50家人形机器人参展商(以及另外~120家工业机器人和零部件公司)推出了20+新产品。我们看到了轮式机器人和双足机器人(全旋转执行器或旋转+线性组合)之间的差异。与我们在2月/5月的访问相比,整体产品性能(WBC或全身控制)在速度和平滑度方面有了相当大的改善。我们看到的那些公司的所有现场演示都运行良好,我们在这方面感到非常惊讶。4.在应用方面,我们认为有四个主要方向:a)用于教育、陈列室导览和舞台表演目的;b)用于开发人员和科学研究/人工智能培训目的的标准平台;c)制造和物流;d)消费者/老年护理/伴侣。a)和b)目前贡献了大部分销量,而对于c)我们遇到的公司告知我们,拣选和放置、分拣、组装和检查等选择性任务的成功率现已达到80-99.5%,并进一步提高主要用于解决长尾和异常情况;而关于机器人的运行速度(推理和执行)是否能与客户的产品线相匹配,机器人公司目前似乎以务实的方式瞄准了非生产线任务,以提高初始产量,并适应未来的柔性制造系统(FMS)需求。我们还了解到,制造商更看重整个系统效率(例如多机器人协作),而不是单个机器人效率,而不是单个人力来完成同一任务。根据一家公司的评论,客户认为18个月的投资回收期是合理的下订单。5.在降低成本方面,我们发现在这些机器人参与者中,国产成分比例似乎相当高(可能已经~80%)。我们注意到,他们今年还致力于设计优化方面,以进一步降低成本,降低了一些硬件规格。展望未来,成交量杠杆仍然是降低成本曲线的关键。6.近期政府补贴消息方面,媒体报道建议消费者购置补贴为每件1,500元人民币(单次购买超过10,000元人民币),企业购置补贴为每件250万元人民币(单次购买超过5百万元人民币)。这些折扣适用于8月2日至8月17日在北京举行的“E-Town机器人消费节”的店内购物。JD.com上还提供在线折扣:消费者和企业订单满6,000元可立减600元人民币,订单满500元可立减50元人民币。
快讯!快讯!宇树科技王兴兴预言机器人的ChatGPT时刻最快一两年就可以到来,最

快讯!快讯!宇树科技王兴兴预言机器人的ChatGPT时刻最快一两年就可以到来,最

快讯!快讯!宇树科技王兴兴预言机器人的ChatGPT时刻最快一两年就可以到来,最迟不过5年!近期王兴兴都发布过类似观点,认为机器人领域有望迎来跟人工智能发布GPT那样的重大突破。此次在世界机器人大会上再次强调,原因就是硬件方面已经成熟,虽然还不够好。他呼吁大家不要太关注机器人本身的硬件数据,如够不够灵活还是成本过高,这些都是可以解决的。相反未来几年,投资者应该更加关注机器人的Ai能力,怎么在真实世界中感知和学习,这些都离不开大模型,所以未来随着人工智能大模型技术的突破,机器人与大模型的融合更为重要。尽管还面临很多挑战,现在很多人看到了这种趋势,但是还没有人去真正做出机器人的大模型,未来几年可能就出来了,这或许也是未来新的主线,也就是硬件向软件的过渡。
人形机器人快进入生活了?宇树科技创始人王兴兴:机器人的ChatGPT时刻快了

人形机器人快进入生活了?宇树科技创始人王兴兴:机器人的ChatGPT时刻快了

他表示,目前的感觉有点像ChatGPT出来前面的1到3年左右时间。目前整个业界大家已经发现了类似的方向以及技术路线,但是没人把它做出来。大家也知道ChatGPT出来前面的几年,做语音AI的已经做了十几二十年了,但是大家一直觉得他...

王兴兴:最快一两年就能达到机器人的ChatGPT时刻

他表示,目前的感觉有点像ChatGPT出来前面的1到3年左右时间。目前整个业界大家已经发现了类似的方向以及技术路线,但是没人把它做出来。大家也知道ChatGPT出来前面的几年,做语音AI的已经做了十几二十年了,但是大家一直觉得他...
Apple 智能将在 iOS 26 集成 OpenAI 的 ChatGPT-5 模型

Apple 智能将在 iOS 26 集成 OpenAI 的 ChatGPT-5 模型

苹果公司已确认(通过9to5Mac),Apple智能将在下个月iOS26发布时集成OpenAI最新推出的ChatGPT-5模型。此次集成意味着,当苹果自身的系统无法处理特定请求时,Siri将能够利用最新的AI模型。OpenAI于周四宣布的ChatGPT-5模型,...
我们的Deepseek怎么啦?R1出来后,迟迟没有后续的升级和更新,是技术出现障

我们的Deepseek怎么啦?R1出来后,迟迟没有后续的升级和更新,是技术出现障

我们的Deepseek怎么啦?R1出来后,迟迟没有后续的升级和更新,是技术出现障碍,难以突破?还是硬件设施因为美国制裁得不到升级?或者是公司经营重点和投入重点出现了改变?据说DeepSeek目前的市场占有率从最高时的40%已经下降至3%了。国内其他的大模型倒是出来了一大堆,呈现百花齐放的景象,但论影响力和系统性能,DeepSeek还是更被关注和期待。因为DeepSeek产品曾经一度被认为是中国在AI领域突破美国封锁取得的重大成就,R1是可以与OpenAi相比拟的产品。国外各家大厂都在往Ai领域拼命砸钱,都在抢占这个赛道,全世界的资金,技术,人才,政策都在往Ai领域倾斜。据美联社8月7日报道,开放人工智能研究中心(OpenAI)于7日发布其支持聊天生成预训练转换器(ChatGPT)的第五代人工智能技术(GPT-5),这一产品更新将被作为检验通用人工智能(AGI)将会迅速推进还是遭遇瓶颈期的标尺。让我们期待DeepSeek再现雄风,尽快能推出更加完善,专业,强大的Ai大模型系统,期待R2带来更大惊喜和进步,Ai之争其实就是国运之争。
一觉醒来,普通的作家,普通的计算机编程程序员和普通的医生可能要失业了,历经两年,

一觉醒来,普通的作家,普通的计算机编程程序员和普通的医生可能要失业了,历经两年,

一觉醒来,普通的作家,普通的计算机编程程序员和普通的医生可能要失业了,历经两年,OpenAI发布了最新的GPT-5,其水平能让普通人能够达到博士生水平,在大模型竞技测试上,GPT-5在文本,网页开发,编程,数学,写作,视觉等等都拿下最高分,是第一名,而且GPT-5完全对注册的ChatGPT用户免费,在性能和速度上更是超越了之前的GPT-4模型,特别是在AI写作,编程和医疗模型这三个方面,连奥尔特曼都不吝言辞地夸赞GPT-5非常出色,按照现在ai的发展速度,很可能再过不久部分低端的写作、低端的计算机编程和普通的医生等等将会面临ai的替代威胁,未来不仅要学会了解和使用ai,还要多提升一些ai不能取代的技能,国内如今的大模型也不太落后,特别是华为的盘古大模型,完成后对各行各业的冲击和贡献将是巨大的!还要DeepSeek,国内不少企业正在基于的DeepSeek的基础上,进一步开发提升更好的ai模型!
我们的Deepseek怎么啦?R1出来后,迟迟没有后续的升级和更新,是技术出现障

我们的Deepseek怎么啦?R1出来后,迟迟没有后续的升级和更新,是技术出现障

我们的Deepseek怎么啦?R1出来后,迟迟没有后续的升级和更新,是技术出现障碍,难以突破?还是硬件设施因为美国制裁得不到升级?或者是公司经营重点和投入重点出现了改变?据说DeepSeek目前的市场占有率从最高时的40%已经下降至3%了。国内其他的大模型倒是出来了一大堆,呈现百花齐放的景象,但论影响力和系统性能,DeepSeek还是更被关注和期待。因为DeepSeek产品曾经一度被认为是中国在AI领域突破美国封锁取得的重大成就,R1是可以与OpenAi相比拟的产品。国外各家大厂都在往Ai领域拼命砸钱,都在抢占这个赛道,全世界的资金,技术,人才,政策都在往Ai领域倾斜。据美联社8月7日报道,开放人工智能研究中心(OpenAI)于7日发布其支持聊天生成预训练转换器(ChatGPT)的第五代人工智能技术(GPT-5),这一产品更新将被作为检验通用人工智能(AGI)将会迅速推进还是遭遇瓶颈期的标尺。让我们期待DeepSeek再现雄风,尽快能推出更加完善,专业,强大的Ai大模型系统,期待R2带来更大惊喜和进步,Ai之争其实就是国运之争。