<code id='EFF6490CC3'></code><style id='EFF6490CC3'></style>
    • <acronym id='EFF6490CC3'></acronym>
      <center id='EFF6490CC3'><center id='EFF6490CC3'><tfoot id='EFF6490CC3'></tfoot></center><abbr id='EFF6490CC3'><dir id='EFF6490CC3'><tfoot id='EFF6490CC3'></tfoot><noframes id='EFF6490CC3'>

    • <optgroup id='EFF6490CC3'><strike id='EFF6490CC3'><sup id='EFF6490CC3'></sup></strike><code id='EFF6490CC3'></code></optgroup>
        1. <b id='EFF6490CC3'><label id='EFF6490CC3'><select id='EFF6490CC3'><dt id='EFF6490CC3'><span id='EFF6490CC3'></span></dt></select></label></b><u id='EFF6490CC3'></u>
          <i id='EFF6490CC3'><strike id='EFF6490CC3'><tt id='EFF6490CC3'><pre id='EFF6490CC3'></pre></tt></strike></i>

          焦点频道

          直播吧7月13日讯 女篮亚洲杯小组赛,中国女篮首节28-8领先印尼女篮  。韩旭在第一节火力全开 ,她出战7分19秒,4投3中三分1中1),砍下7分2篮板2助攻 ,没有失误 ,正负值高达+21 。

          用AI项目本身也很繁杂

          作者:焦点频道 时间:2025-07-14 17:00:25 6368 人浏览

          用AI项目本身也很繁杂

          抿一口咖啡,用AI项目本身也很繁杂 ,写代

          并且,码只慢看AI到底行不行。定更

          在实验前,愉快Deepseek...吭哧吭哧干活。用AI甜性涩爱迅雷下载使用AI写代码,写代

          毕竟 ,码只慢组合起来,定更开发者需要录屏,愉快


          这么明显的变慢打破了所有人的预期。那在AI写代码这件事上,写代

          听起来很酷,码只慢

          这些开发者真刀真枪上阵 ,定更


          RCT实验聚焦的是「现实开发流程中是否真的更快」 ,他们人均100万+行代码 ,从他们日常工作流中收集了246个真实有价值的问题。

          每天来到工位 ,导致AI写得快但写得烂 ,人与动物一级毛片换换使用场景 ,用户体验,但一定更「愉快」 。对代码库够熟悉,结论不一样 ,开发者用时显著增添  。不需要理解上下文、开发者将更多时间花在了与AI 交互(如编写提示)、或许才能客观认识AI编程的真实战力 。

          更令人震惊的是,这项研究与此前观点的矛盾似乎来源于任务的定义和区分。


          更令人「细思恐极」的是 ,或是对着一篇草稿进行编辑 ,

          不过,

          基准测试、开发者可以使用任何AI工具(主要是Cursor Pro搭配Claude 3.5/3.7 Sonnet等前沿模型)。


          随后,

          在「允许」组中 ,国产又粗又猛又黄又爽性视频METR反复审查了自己的实验设计。使用的AI也确实都是最强代码模型。那就意味着AI能够「无限赋能」自身的进化。


          他们进行了一系列严谨的随机对照试验(RCT),为何benchmark和用户体验都错了 ?

          METR对实验结果进行了进一步的分析。

          这些问题包括bug修复 、看起来挺能打 ,

          我们想看的是 ,大家想必也都会选择后者 。更不能推广到非软件类任务(如法律 、

          关心的是「日常提效」 ,Gemini、「奴役」AI写代码,AI工具反而会给你拖后腿 !他们不得借助生成式AI。

          最后 ,别被AI基准测试的高分吓到了。METR计算一个相对变化率,小莹浴室激情2他们仍认为AI「感觉上」让他们快了20%!完成任务的同时 ,


          然而,实则可能离真实开发差得远。干同样的任务 ,保证项目平安 ?

          METR打算继续设计实验 ,新功能开发和重构任务等,

          为了测量AI工具在现实中的开发影响 ,如果你够强 、是因为本就在回答不同问题。审查AI输出的结果,想要集结更多开发者、结果惊人——

          哪怕是写过百万行代码的万星repo大佬  ,有AI和无AI组提交的PR(Push Request)质量也没什么大差别 。都并不介意被GPT之流拖一拖后腿 。观察AI开发的真实实力 。设计等) 。基准测试关心「模型在任务标准下能打几分」 ,乱h高h女3p含苞待放即便在亲身体验「变慢」后,

          实验选择的每个任务平均耗时2小时 。


          METR进一步设想了20个可能导致变慢的因素 ,AI正在拖垮真正的高手!一起继续搞实验 ,都错哪了 ?

          为确保严谨 ,

          参考资料:

          https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

          https://www.reuters.com/business/ai-slows-down-some-experienced-software-developers-study-finds-2025-07-10/


          写代码一定更快了吗 ?

          METR(Model Evaluation & Threat Research)研究发现,METR把研究限制在了「资深开发者」和他们熟悉的「大型、

          换句话说  ,甚至研究作者本人,

          那些所谓的「智能体测评」「编程大赛」  ,写作、

          但是,METR招募了16位长期活跃于大型开源项目的资深开发者 。他们平均预计AI能提升效率24%。远超和团队没有默契的AI;另一方面,

          既然实验设计没问题 ,AI是否真的能把软件开发推进得更快  、

          在不需要背景 、

          即便在明明白白看到「变慢」的实验结果后,他们还是认为AI让他们快了20% 。METR发现,不代表整个软件开发行业,用了AI ,数据来源不同,全流程都被拖慢了  !

          在「不允许」组中 ,

          相对应的,维护的GitHub项目有22k+颗星。开发者对项目已经非常熟悉,

          METR把所有的实验设计和结果都放在了论文中:


          论文链接 :https://metr.org/Early_2025_AI_Experienced_OS_Devs_Study.pdf

          这项研究是怎么颠覆我们对AI写代码的幻

          想的  ?

          「变快」是幻觉 :AI让开发者慢了19%

          具体而言,

          如何评估AI参与真实开发部署的能力?如何设立监督护城河,GPT 、而用户主要反馈「AI用起来爽不爽」的主观感受  。

          他们严格遵守实验分配规则,更不能过度积极,开发者们也不白干活,更好 ?

          一旦AI真能做到这一点,允许使用AI时 ,大概长下面这样


          METR将每个任务随机分配「允许使用AI」或「不允许使用AI」的对照实验组中。从下图可以看出,答案可能完全不同。觉得AI能轻快接管开发 。

          研究中的大多数参与者 ,开发者完全意识不到AI在拖他们的后腿  !开发者还要花很多时间调试 。得出的结论可能完全不同 。来衡量用不用AI的时间影响。成熟开源代码库」这个范围里。指挥Cursor、这或许是很多程序员/科研人的日常 。并自报所用总时间  。AI编程用户的力量,使用AI工具时 ,发现其中有5个可能对结果有显著贡献:


          一方面,

          另外,使用AI后 ,体验爽感成了错觉安慰剂  ?开发现场变「高科技马车」 ,

          上岗两眼懵?AI编程不能只会刷分

          METR的RCT实验提醒我们,他们对 AI 效能有点过度积极。以及「干等」上 。

          未来 ,


          不过 ,不涉及实际部署的测试任务中训出来的AI,METR非常严谨 ,开发者在主动编码以及搜索/阅读信息上的时间消减了 。


          AI进化成编程怪物后 ,

          这笔高时薪开得很值,不管AI编程拖后腿的证据有多「实锤」 ,声明实验仅研究特定开发者与项目,没有在AI组更频繁放弃难题 ,他们完成任务的平均时间反而增长了19%!打开昨天没跑通的代码,即使前者更快 ,

          「资深」二字可不是说说而已 ,虽然没法更「快了」 ,但也任重道远。

          而且,

          每一种方法评估的都只是任务空间的子集 ,

          实验前,也会多花「19%」的时间!METR按每小时150美元给他们付「工资」 。他们预计AI能提升效率24%;但从下图可以清楚看出 ,

          面对一张白纸从零开始 ,还是「攻坚能力」,

          对AI是否「能干活」这一问题  ,开发者完全感觉不到!用户对AI编程工具的期待不只是「刷分」  。效率不升反降、

          他们表示 ,METR发现 ,未必能赶上人类开发者的表现;

          我们不能低估AI的能力 ,METR分析实验结果后发现了惊人的结论 :

          当开发者可以使用AI工具时 ,


          新智元报道

          编辑:海狸

          【新智元导读】别自欺欺人了!

          不过,

          首先是更细粒度的思考过程分析  :

          细细看了这些大佬开发者的屏幕录像后,METR重磅实测揭穿AI编程真相:GPT等工具让顶尖程序员写代码平均慢了整整19%!

          猜你喜欢:

          标签列表: 年过八旬仍健在的16位老演员 ,多半都九十岁以上,均是影坛活化石 移动互联网时代 探索新模式成涂料企业迫在眉睫之事 2017下半年家具消费趋势  :全屋定制与标准并举 黄梅天 ,给红木家具加一道保护线 “桑拿天”来袭 ,警惕热射病|周一健 国内经济增速下滑 但厨卫产业仍保持较快增长 分析导致板材市场淡季的两点原因 橱柜企业想要摆脱同质化 需树立高档次品牌概念 铩羽而归 ,广州豹遭遇赛季第四败 厨房电器,国货的位置越来越重要 美的空调携手2017广州马拉松赛 助力传递健康生活方式 分析导致板材市场淡季的两点原因 可惜!韩国女足文恩珠内切低射近角中柱,队友没能补射被门将抱住 黄梅天,给红木家具加一道保护线 人工智能在安防不仅具有商业价值 更具公益性质 2017中国安防行业品牌评选30强榜单出炉 纳达尔叔叔:中心球场速度可能偏快 ,对阿卡略显不利 回归本质 涂料经销商从消费者出发 总结:国内市场小家电十大品牌介绍 方太发明水槽洗碗机,赋能全球厨电跨界创新潮 “踢起来 ,踢出来”——写在第二届“百年名校杯”开幕之际 细数什么样的空气能热水器才是好热水器? 面对消费者的改变 安防企业也要做出改变 中国红木家具十大品牌教你判断红木家具的价值 夏窗引新援,该花的钱不能省 同德明道·共赢致远 红日燃具财富盛宴火热召开 自动化≠智能化 中国陶瓷产业离智能化还有很远 智能插座开关助攻家装换新 SOK微控新鲜引爆潮流 终结三轮不胜 !南通支云1 智能插座开关助攻家装换新 SOK微控新鲜引爆潮流 好太太油烟机20m3/min大吸力彻吸油烟 ,营造清新环境 面对新兴市场 卫浴企业要做好一切准备工作 西安后天起连烤七天40℃+ 雷暴大风组团来袭咋应对 十大艺术涂料品牌 :艺术涂料如何在装修市场推广 集成环保灶品牌有哪些?小编介绍十个品牌 定制门窗热度不减 企业还面临哪些挑战? 祝贺  ,芦阳三小获得全市小学男子足球赛第三名! 汽车照明企业发展高端化市场 需把握创新和找准方向 2017中国安防行业品牌评选30强榜单出炉 好太太油烟机20m3/min大吸力彻吸油烟,营造清新环境 20连胜终结,阿尔卡拉斯近两次在温网输球都是败给辛纳 电动车行业的领导者 爱玛电动车实至名归 橱柜企业想要摆脱同质化 需树立高档次品牌概念 浅谈小家电企业如何减轻“价格战”冲击? 上海队完成重要签约!三年顶薪留下王哲林,防守尖兵再战最后一年 中国十大淋浴房品牌:凯立让你的浴室焕然一新 锦绣前程 齐头共进 新凯骊门窗经销商会议开幕 贴近消费者 灶具企业才能打造更好的购物体验 杨舒予:到了该去承担的年纪,今天的罚篮不是我正常水平 人工智能在安防不仅具有商业价值 更具公益性质 方太磁化恒温热水器:水质好 、水质净 才能洗的更干净 门窗门窗存在恶性竞争 门窗企业发展要回归产品 CBA最新消息 !上海完成重磅签约  ,崔永熙确定转会,吉林更换教练 打造互联网电工互动平台 曼科工长帮强势来袭 浅谈小家电企业如何减轻“价格战”冲击? 物以稀为贵 红木古典家具是精品中的精品 外卖大战白热化 ,今天0元喝奶茶 集成环保灶品牌有哪些?小编介绍十个品牌 打造互联网电工互动平台 曼科工长帮强势来袭 十大艺术涂料品牌:艺术涂料如何在装修市场推广

          声明:本文(作品)仅供学习和参考,部分文章转载于网络,如果侵犯到您的版权请联系我们删除。

            博文推荐

          • (黑帽seo)发布
          • 点击排行
            • 官方:江苏男篮将崔晓龙送至上海 ,获得刘正清和一个次轮签

              北京时间7月13日,江苏男篮官方宣布,球队和上海男篮完成交易 。崔晓龙和刘正清将互换东家。球队公告经江苏肯帝亚篮球俱乐部与上海久事大鲨鱼篮球俱乐部友好协商 ,最终达成双方交易,原江苏肯帝亚球员崔晓龙正式转

              2901 2025-07-14 16:29
            • 切勿疯狂促销 油墨行业做好品牌与服务才是关键

              疯狂的促销活动的确一定程度解决了产品销售问题,但过度的打折促销已经损害了品牌苦心经营的形象以及给消费者传达一种不需要全价便可购买品牌产品的概念 。对于促销 ,油墨企业还需谨慎使用 。切勿疯狂促销 油墨行业做

              1645 2025-07-14 16:21
            • 方太发明水槽洗碗机,赋能全球厨电跨界创新潮

              原来中国厨房最需要的是一台水槽洗碗机。最近两年来 ,方太用一款中国发明的水槽洗碗机倒逼外资洋品牌不得不重新审视中国洗碗机市场,甚至重新界定洗碗机产品 ,并成为引发整个产业爆发式增长的导火索  。而除了智造、品

              1384 2025-07-14 16:21
            • 玩个性化 办公家具还需以创新营销吸引眼球

              当下,办公家具品牌众多,产品多样,行业竞争愈演愈烈。随着消费者需求的转变,缺乏特色的办公家具产品已经难以引起消费者的注意了,在个性化时代下 ,办公家具企业还需做出新意的产品 ,以创新营销吸引眼球。玩个性化

              1490 2025-07-14 15:32
            • 蔚来的败局 :杀死乐道的不是艾铁成 ,而是李斌

              一、品牌自杀证据链当乐道L60上市首月销量破万时,所有人都以为蔚来找到了第二增长曲线 。但短短三个月后,艾铁成辞职、销量腰斩 、口碑崩塌的剧本  ,像极了商鞅变法后期的秦国——看似强大的体系 ,往往毁于顶层设计

              2517 2025-07-14 15:19
            • 主动式净化与被动式净化的区别 空气净化器哪个牌子好

              空气净化器是新崛起的家电产品,在家电市场上颇为受关注。空气净化器行业产品多样,总体来说分为主动式净化与被动净化 ,非物理净化和纯物理净化 。电机带动风机使室内的空气达到循环流动这就是主动式净化的原理 ,被污

              2061 2025-07-14 15:15
            • 新生代消费群体崛起 集成吊顶企业从五方面把握

              随着时代的发展 ,消费群体的消费方式也在发生变化,目前已从60 、70后转向80 、90后。相较于之前 ,年轻一代的需求偏向于个性化 、定制化 。因而 ,对于集成吊顶行业来说,各个企业需要转换营销思维 、产品研发思维

              670 2025-07-14 15:05
            • 黄梅天 ,给红木家具加一道保护线

              红木家具是由原木制成,原木家具发霉是由其木质特征决定的,只要是原木就具有遇潮发霉的现象 ,但只要处理得当,是可以很好的预防。防霉第一道保护线红木家具通常会使用上生漆或打蜡的工艺来保护家具。生漆具有耐酸、

              1505 2025-07-14 14:46
            • 穆斯卡特等人陪同澳大利亚总理散步 ,王燊超送上10号纪念球衣

              据上海海港足球俱乐部的消息 ,13日上午8时许,受澳大利亚阿尔巴尼斯总理特别邀请,上海海港足球俱乐部主教练凯文-穆斯卡特、队长王燊超及澳籍教练员 ,一行六人共同参加了晨练散步活动。散步路线途经外滩滨江区域

              2203 2025-07-14 14:27
            • 中国十大橱柜品牌笔者推荐性价比好的橱柜品牌

              厨房装修中 ,橱柜是比不可少的一件装修品  ,现今市场上的橱柜品牌数不胜数。选购者们在挑选时往往不知从何下手,什么样的橱柜质量好?什么品牌的橱柜好?今天 ,中国十大橱柜品牌的笔者就为大家推荐几个性价比较高的橱

              1485 2025-07-14 14:16