OpenAI推出不到一周的最新旗舰模型没能等来“好评如潮 ”。
近日 ,OpenAI在十周年之际发布了GPT-5.2系列模型,官方数据显示其在GDPval等专业基准测试中超越人类专家,是迄今为止在“专业知识工作方面”表现最好的模型 。
据OpenAI官方披露,GPT-5.2在多领域实现技术突破:GDPval测试中覆盖44个职业的任务表现70.9%优于顶尖专家 ,SWE-bench Pro编程测试获55.6%的SOTA成绩,还将幻觉率较GPT-5.1降低38%。该公司CEO山姆·奥特曼称其为“许久以来最大的升级”,并透露计划2026年1月解除应对谷歌竞争的“红色警报”。
但该模型上线后遭到大量用户吐槽 ,认为其从常识问答到情感交互,“智商不稳定 ”。
SimpleBench常识推理测试显示,GPT-5.2得分低于Anthropic发布的Claude Sonnet 3.7 ,甚至在“garlic有几个r”的基础问题上反复出错——有用户三次测试仅一次答对,而谷歌的Gemini 3.0等竞品均稳定通关 。该测试旨在评估大模型在处理普通人认为简单,但对机器而言充满挑战的逻辑推理任务的能力。前AWS总经理Bindu Reddy直言 ,“不值得从GPT-5.1升级”。
网友晒出GPT-5.2在SimpleBench上的成绩单 。
一些编程爱好者则发现,GPT-5.2生成的交通灯模拟代码画面仅达“黑白火柴人级别 ”,蒙娜丽莎ASCII艺术创作效果远逊于GPT-4o。情感交互中有用户倾诉“恐慌发作” ,竟收到“很高兴听到这个消息”的回复,安慰失宠孩童时则机械强调“生物都会停止运作 ”,缺乏此前版本的亲和力和自然表达。
此外,该版本在处理连续对话时不稳定 ,甚至在明确选择“高级思考模式”时也会返回低质量的自动响应,令用户不得不重新调整使用方式 。
还有用户表示,GPT-5.2的安全策略实施过于严格 ,在执行普通且无风险的请求时也会拒绝操作并给出无关的安全提示。
有观察人士指出,这轮差评潮背后存在几重因素。一方面,OpenAI推广时着重强调GPT-5.2的专业能力和基准测试成绩 ,但普通用户更关注日常对话 、流畅性和创造性体验,两者的期望存在错位;另一方面,由于竞争加剧和内部发布节奏加快 ,有观点认为该版本可能发布过早,尚未充分优化在关键使用场景中的稳定性与一致性,因此用户的实际感受出现明显落差 。
截至发稿 ,OpenAI尚未就这轮用户反馈作出公开回应,但公司在官方资料中表示,会持续改善用户体验、优化安全策略,并根据用户反馈推进后续版本的迭代。
当前 ,OpenAI仍面临来自谷歌的巨大竞争压力。谷歌此前推出的Gemini 3在编程、多模态理解等关键企业应用场景上实现了对ChatGPT的性能超越 。11月,谷歌宣布Gemini月活跃用户已突破6.5亿,较7月报告的4.5亿实现大幅增长 ,而OpenAI披露的周活跃用户数接近8亿。
为此,奥特曼曾发布“红色代码”警报,决定暂时搁置包括Sora视频生成器在内的长期研发项目 ,转而在短期内全力通过提升用户活跃度来巩固ChatGPT的大众市场地位。但急转直下的口碑或在很大程度上影响ChatGPT的使用率,OpenAI能否拿出更强有力的“武器 ”反击谷歌仍存在不确定性。
什么炒股软件可以杠杆:股票选股app工具十大排名-卸任福耀董事长 79岁曹德旺回应:接班团队很优秀 明年考虑彻底退休
看股票的app软件:股票选股app软件十大排名-宗馥莉正式接任娃哈哈实业董事长!
配资最新:无人机最好的股票排名-7月30日北向资金最新动向(附十大成交股)
股票开户哪一个app好:十大股票杠杆排名-机构大手笔调仓 近百亿资金借道ETF涌入这个板块
买卖股票的app:最新配资平台排名-七家协会联合发布关于防范涉虚拟货币等非法活动的风险提示
中国股票app排名:炒股加杠杆怎么申请-英伟达重磅!黄仁勋最新演讲勾勒AI宏伟蓝图:6G、核聚变、机器人、自动驾驶、超算全都有份
网络配资-正规配资平台官网-股票配资app下载提示:文章来自网络,不代表本站观点。
美股市场:美股三大指数08月01日收盘全线下跌,道指日线5连跌。截至收盘,道琼斯工业平均指数比前一交易日下跌542...
国务院办公厅日前印发《关于进一步完善信用修复制度的实施方案》(以下简称《实施方案》),旨在进一步完善统一规范、协同共...
界面新闻记者|邹文榕继1月正式取得经营证券期货业务许可证后,3月21日,国信证券资产管理有限公司(下称:国信...
界面新闻记者|曾令俊“整体来...
界面新闻记者|刘晨光近日,两家头部互联网券商富途控股(FUTU.O)和老虎证券(TIGR.O)公布了2024...
记者闫桂花国务院发展研究中心市场经济研究所原所长王微日前表示,服务消费在扩大内需、提振消费的过程中大有...
在岸人民币兑美元(CNY)北京时间03:00收报7.2506元,较周四夜盘收盘跌11点。成交量437.69亿美元。...
2025环球资源四月香港展今日正式揭幕,一期展会即日起至4月14日于香港亚洲国际博览馆举行。本次展会集游戏、消费电子、电...
界面新闻记者|孙艺真随着我国金融市场制度型开放有序推进,当前,外资金融机构纷纷抢抓金融双向开放的机遇,不断加...
界面新闻记者|沈溦、陈慧东3月13日晚间,拿下4连板的狮头股份(600539.SH)发布股价异动公告称,利珀...
记者|赵阳戈进入2025年,主动退市再现案例。3月29日,中航产融(600705.SH)主动退市...
今天(3月23日),中国发展高层论坛2025年年会在北京举行,在此次年会上,中央财经委员会办公室分管日常工作的副主任、中...
上期所原油期货夜盘收涨0.83%,报535.7元/桶。沪金主力合约收跌0.47%,报705元/克,沪银主力合约收跌0.6...
截至2025年4月11日收盘,上证科创板50成份指数(000688)强势上涨2.07%,成分股澜起科技(688008)上...
界面新闻记者|邹文榕近段时间,一款信托合同当中隐藏“受益人代表/委托人代表”条款的政信信托开始在江浙等区域流...