Transformer开山论文惊天「翻车」，图与代码不一致，_焦点热文

菜单

首页资讯文物艺术鉴赏作品历史热门头条拍卖名家

当前位置：首页 > 热门 > 正文

Transformer开山论文惊天「翻车」，图与代码不一致，_焦点热文

来源：互联网时间：2023-05-10 12:55:42

图与代码不一致的论文，很「常见」，不过提出了 Transformer 的开山鼻祖论文，竟然也出现了同样的错误？

今天，AI 圈被一个惊天「翻车」刷屏了。

谷歌大脑的 NLP 奠基之作、提出 Transformer 架构的开山鼻祖级论文《Attention Is All Your Need》中的图，被网友扒出与代码并不一致。

(资料图片)

论文地址：https://arxiv.org/ abs / 1706.03762

自 2017 年问世以来，Transformer 已经成为 AI 领域的基石王者。就连大红大紫的 ChatGPT 真正的幕后大佬也是它。

2019 年，谷歌还专门为它申请了专利。

归宗溯源，现在各类层出不穷的 GPT（Generative Pre-trained Transformer），都起源于这篇 17 年的论文。

据 Google Scholar，截止目前，这篇奠基之作已有 7 万多次的引用。

所以，ChatGPT 的奠基石都不稳了？

作为「开山鼻祖」的论文，结构图竟是错的？
Lightning AI 创始人、机器学习研究者 Sebastian Raschka 发现，这篇论文中 Transformer 的图是错误的。
图中被圈出的地方，LayerNorms 是在注意力和全连接层之后。在残差块之间放置层归一化，会导致输出层附近参数的预期梯度很大。
而且，这也与代码不一致。
代码地址：https://github.com/ tensorflow / tensor2tensor / commit / f5c9b17e617ea9179b7d84d36b1e8162cb369f25#diff-76e2b94ef16871bdbf46bf04dfe7f1477bafb884748f08197c9cf1b10a4dd78e
不过有网友指出，Noam shazeer 在几周后对代码进行了纠正。
随后，Sebastian 称，在论文 Layer Normalization in the Transformer Architecture 中，Pre-LN 表现得更好，可以解决梯度问题。
这是很多或者大多数架构在实践中所采用的，但它可能导致表征崩溃。
如果层归一化在注意力和全连接层之前被放置在残差连接之中，就会实现更好的梯度。
Sebastian 提出，虽然关于使用 Post-LN 或 Pre-LN 的讨论仍在进行中，但也有一篇新论文提议把二者结合起来。
论文地址：https://arxiv.org/ abs / 2304.14802
在这种双残差 Tranformer 中，表征崩溃和梯度消失的问题都得到了解决。

网友热议
针对论文中的疑点，有网友指出：中间不是已经有了 PreLN 和 PostLN 了吗？
Sebastian 回答说，自己也觉得有点奇怪。或许 2nd LN 指的是最后一个输出层，而不是每个 transformer 块，但他对此也不确定。
有网友表示：「我们经常遇到与代码或结果不匹配的论文。大多数就是出于错误，但有时也会让人很奇怪。而这篇论文已经流传甚久了，为什么这种问题此前从没被人提出过，这真的很奇怪。」
Sebastian 表示，公平地讲，最原始的代码是和图片一致的，但他们在 2017 年修改了代码版本，却没有更新图片。所以，这很令人困惑。
有网友表示，已经有论文在 NormFormer 中展示了一个不太复杂的架构，而他的团队最近也证实了他们的结果。而 ResiDual 论文没有在任何地方提到 NormFormer，这让人很惊讶。
同时，评论区不断出现网友证实：Transformers 中使用的 LN，与 CNN 中使用的方式并不同。
所以，论文真的存在漏洞，还是乌龙事件？
让我们静观后续。
参考资料：
https://twitter.com/rasbt/status/1655575611979489282
本文来自微信公众号：新智元（ID：AI_era）

X 关闭

最近更新

Transformer开山论文惊天「翻车」，图与代码不一致，_焦点热文

时间： 2023-05-10
观酒周报｜酒鬼酒解释Q1业绩受费改影响；五粮液：渠道库存量属正常水平；“五一”烟酒销售额同增15%

时间： 2023-05-10
茂盛桥6,8号民居_关于茂盛桥6,8号民居的简介天天即时看

时间： 2023-05-10
埋怨是试图让对方承担责任的方式|全球热文

时间： 2023-05-10
环球报道:世界地贫日‖@备孕夫妻：这种贫血很可怕筛查记得做

时间： 2023-05-10
小满时节畅享自然之美，斯巴鲁森林人就是最适合你的SUV-当前通讯

时间： 2023-05-10
全球观天下！电脑怎么看ip地址快捷键_电脑怎么看ip地址

时间： 2023-05-10
康斯特：目前已与天津大学、河北大学、北京航空航天大学、中国石油大学、上海工程技术大学、河北石油职业技术大学等十余所高校-全球即时看

时间： 2023-05-10
中国船厂建造！NOV获Havfram第2艘自升式风电安装船合同_全球聚焦

时间： 2023-05-10
野地现无名女尸山西警方发协查通告：中等身材牙齿有缺失|全球快播

时间： 2023-05-10
全球实时：氧化铝期货上市渐行渐近上期所就相关规则征求意见

时间： 2023-05-10
【全球独家】“高拟真数字大熊猫”研发启动

时间： 2023-05-10
天天讯息：美国白宫官员：美国总统拜登不久后将发表关于债务上限会议的讲话。

时间： 2023-05-10
因内部分歧，欧盟近期或无法就新一轮对俄制裁达一致_天天速讯

时间： 2023-05-10
超高清视频板块5月9日跌0.7%，艾比森领跌，主力资金净流出3.16亿元

时间： 2023-05-10
关于诚信的诗有哪些_关于诚信的诗|天天动态

时间： 2023-05-10
全球播报:集美儿童公园预约及入园规则有变

时间： 2023-05-09
世界快资讯：思必驰IPO被否，经营能力可持续性遭质疑

时间： 2023-05-09
梅西未来扑朔迷离！法媒称沙特土豪5亿年薪达成协议，罗马诺辟谣每日热点

时间： 2023-05-09
曹崧_对于曹崧简单介绍焦点速读

时间： 2023-05-09
课堂精练七年级上数学答案北师大版课堂精练七年级上数学答案头条焦点

时间： 2023-05-09
全球观天下！2023仙境海岸海阳马拉松项目+比赛路线海阳马拉松2021时间表

时间： 2023-05-09
精选！医疗保险要交多少年才能享受待遇　职工医疗保险住院报销比例是多少

时间： 2023-05-09
最高奖3000元！洛阳面向全网征集科普短视频

时间： 2023-05-09
农行纸黄金USD5月9日开盘价2028.85 昨收价2028.65

时间： 2023-05-09
关于家庭教育的名言_教育的名言世界资讯

时间： 2023-05-09
环球速读：lol隐藏分多少算正常

时间： 2023-05-09
白云机场：子公司与北京沃捷签署广告媒体经营项目合同

时间： 2023-05-09
赞！晋安这项工作，连续三年全市第一！-全球快播

时间： 2023-05-09
瑞典央行副行长布雷曼：如果通胀在高水平上变得稳固，我将毫不犹豫地继续逐步加息，延长加息路径所显示的时间，并/或恢复超过0.25个百分点的加息幅度

时间： 2023-05-09
世界新动态：印度空军又一架米格-21坠毁

时间： 2023-05-09
焦点日报：杨叶镇中心学校全面推进从严治教依法治教

时间： 2023-05-09
【世界红十字日】“红丝带红十字” 防艾宣传 “5·8”行天天速讯

时间： 2023-05-09
当前焦点!白色风扇消失，猫头鹰 Nuctua 公布最新路线图

时间： 2023-05-09
宿王昌龄隐居朗诵_宿王昌龄隐居焦点资讯

时间： 2023-05-09
锦州为农业设施颁发物权登记证解决经营主体融资难问题|世界微速讯

时间： 2023-05-09
【世界热闻】小红书电商的“第一口螃蟹”，9块9包邮真香？

时间： 2023-05-09
APP被苹果商店下架？陌陌回应：已重新上架全球时讯

时间： 2023-05-09
【环球快播报】治疗脑动脉瘤“利器”落地博鳌乐城

时间： 2023-05-09
江苏无锡：乘“数”而上竞逐“数字赛道”，全场景数字化运营城市呼之欲出|时快讯

时间： 2023-05-09
深圳发布用电营商环境20条改革举措-全球微动态

时间： 2023-05-09
经纪人：斯皮纳佐拉踢了一个伟大的赛季，他和罗马的合同还剩一年_全球资讯

时间： 2023-05-09
2023中国电信国际有限公司第二批招聘19人公告

时间： 2023-05-09
世界热讯:保本高息灵活支取可质押存单真香？

时间： 2023-05-09
焦点滚动:Steam优化搜索功能 / 手游广告碰瓷《王国之泪》

时间： 2023-05-09
每日头条!水手告别意甲！桑普提前四轮降入意乙，本赛季意甲首支降级队产生

时间： 2023-05-09
天天最资讯丨前列腺手术有几种治疗方法（前列腺手术有哪几种）

时间： 2023-05-09
涤太太是哪个国家的品牌_什么档次怎么样

时间： 2023-05-09
辽宁开门红，杨鸣被二老打服了！合力统治篮下，已完成多次救主！

时间： 2023-05-09
郭德纲郭麒麟歪唱太平歌词_歪唱太平歌词

时间： 2023-05-08
《高达：水星的魔女》新一集观看后的观感，个人感觉，并非引战，但是很爽。_世界通讯

时间： 2023-05-08
课堂上突然有学生举手还满脸通红，音乐老师紧急施救

时间： 2023-05-08
昌平霍营西路至立汤路预计年底前开工

时间： 2023-05-08
情人节听什么歌_适合情人节听的歌曲

时间： 2023-05-08
焕然一新的近义词万象更新_焕然一新的近义词-热推荐

时间： 2023-05-08
世界热议:蔚来法务部账号上线：百万粉博主“小牛说车”已被正式起诉

时间： 2023-05-08
伊朗外交部发言人: 伊沙双方在重开使领馆方面取得良好进展_焦点快看

时间： 2023-05-08
环球消息！昔日网红葱油饼店主“阿大”擅自装修天井被叫停，重操旧业还有希望吗？

时间： 2023-05-08
多主力现身龙虎榜，中央商场跌停（05-08）

时间： 2023-05-08
我实习期上班没有看管好，结果屋顶漏水导致机台发生损坏，公司会

时间： 2023-05-08
研究指出冰川消融使北极汞污染加剧

时间： 2023-05-08
医疗保险一年多少钱？附2023热销医疗保险价格表-全球快资讯

时间： 2023-05-08
世界快资讯丨港股概念追踪 | 全国各地点燃“马拉松热”！运动装备需求回升头部运动品牌迎配置良机(附概念股)

时间： 2023-05-08
聚焦：泰安全面推行“二码合一”试点改革助力企业“一码通行”

时间： 2023-05-08
江北：盘活消费市场为景区发展注入“税力量”-最新消息

时间： 2023-05-08
当前消息！泡泡玛特的对手，在东南亚赚翻了

时间： 2023-05-08
220元/股！*ST左江成A股史上最贵ST股_全球热文

时间： 2023-05-08
温州富豪赖国贵：出身“富二代”，身家70亿，为何放弃美国绿卡？

时间： 2023-05-08
每日观点：AMD为ROG掌机定制神U：功耗性能都绝了

时间： 2023-05-08
失去打光秒变路人，眼距太宽难坏修图师，新生代小花颜值太照骗

时间： 2023-05-08
世界快看点丨海外情报：布莱顿2-1埃弗顿

时间： 2023-05-08
中信证券：算力上游与运营商整体超预期泛数字经济板块有望逐步改善

时间： 2023-05-08
全球观点：学生的心田开满鲜花

时间： 2023-05-08
弱势群体争夺福利名额！印度爆发部落冲突，已致54名平民丧生

时间： 2023-05-08
华为也拉不动赛力斯了？

时间： 2023-05-08
“小挣青年”又刷屏热词变迁折射了啥_环球热点

时间： 2023-05-08
2023上海车展：i7 M70L体验 1100牛米还带M的宝马电动车

时间： 2023-05-08
江宁高新区督促整改餐厨垃圾收集点-环球快报

时间： 2023-05-08
拉塞尔：詹姆斯很需要我拿不到1.8亿就离开湖人随时可拎包换队

时间： 2023-05-08
常山赵子龙刘德华解说_常山赵子龙刘德华-每日速读

时间： 2023-05-08
全球快讯:十次加息，美国如何伤害了世界

时间： 2023-05-07
呼和浩特市门诊诊察费纳入医保报销

时间： 2023-05-07
广泛开拓就业渠道！教育部2023年这么干→ 天天讯息

时间： 2023-05-07
新时代文明实践｜立夏养生科普讲座为居民健康“保驾护航”

时间： 2023-05-07
员工不转朋友圈被罚 1 万且开除？法院判了-天天快消息

时间： 2023-05-07
联创电子：拟以1亿元-2亿元回购股份当前焦点

时间： 2023-05-07
环球热讯:还得是巴菲特，完美错过AI风口，但又赚了2000亿

时间： 2023-05-07
光正眼科：预计未来2-3年眼科行业仍将保持较高增速

时间： 2023-05-07
当前最新：江西暴雨致29.3万人受灾直接经济损失2.3亿元

时间： 2023-05-07
心态炸裂哈兰德射门偏出，瓜帅暴怒+自言自语+踢爆草皮世界关注

时间： 2023-05-07
世界热议:韩国市民团体集会抗议日本首相岸田文雄访韩

时间： 2023-05-07
天天快播：三亚至乐东公交化旅游化铁路改造工程将于年内建成

时间： 2023-05-07
世界快讯:洛阳：栽下红薯致富苗铺就乡村振兴路

时间： 2023-05-07
世界速读：混凝土c30是什么意思_混凝土c30

时间： 2023-05-07
地理7年级上册_地理7年级上册基础训练答案人教版2020

时间： 2023-05-07
一张售价10万元的采砂单子，是谁撕开了制度口子|天天速看料

时间： 2023-05-07
意甲积分榜：国米4连胜回第4，米兰降至第5，罗马4轮不胜仍第7

时间： 2023-05-07
考研数学二考什么书_考研数学二考什么环球热门

时间： 2023-05-07
邱圆圆个人资料简介_邱圆圆

时间： 2023-05-07
电视什么品牌好排前十名_电视什么品牌好|世界快看点

时间： 2023-05-06
全球快讯:“煤炭重镇”山西吕梁加码氢能产业挺进“千亿级”赛道

时间： 2023-05-06
“虹浦号”盾构机顺利接收，度假区站至凌空路转换井盾构区间贯通-最新

时间： 2023-05-06
家用冰箱直冷好还是风冷好（冰箱直冷和风冷无霜哪个好）_视点

时间： 2023-05-06
【天天播资讯】本地生活牌桌，快手“慢半拍”

时间： 2023-05-06
坐上动车去赶大理三月街

时间： 2023-05-06
伟星新材(002372.SZ)：2023年公司营收目标力争达到76.50亿元|每日头条

时间： 2023-05-06
实时焦点：科大讯飞发布星火认知大模型，刘庆峰：与ChatGPT只有细微差距

时间： 2023-05-06
聚焦：带日字旁的字有哪些_带日字旁的字

时间： 2023-05-06
天天新消息丨恩比德：成为一名父亲改变了我的一生我想成为儿子的好榜样

时间： 2023-05-06
玫瑰之夜综艺_玫瑰之夜情人网

时间： 2023-05-06
强信心·走进百企丨数字货运平台透视经济复苏智慧物流助中小企业“拼经济”

时间： 2023-05-06
银行业动荡西太平洋合众银行(PACW.US)大幅削减季度股息至1美分天天观点

时间： 2023-05-06
【热闻】美国4月新增就业25.3万人失业率降至3.4%

时间： 2023-05-06
芸上梯田油菜花开！北京温榆河公园特设了打卡景观，抓紧！_当前简讯

时间： 2023-05-06
江西宜春启动防汛三级应急响应

时间： 2023-05-06
天天热文：真我11系列发布会邀请函超越影像旗舰

时间： 2023-05-06
江西省定南县天九镇东山村——共话产业谋发展（全过程人民民主·在现场）

时间： 2023-05-06
没有比亚迪的欧洲，拱手将市场交给了日系车

时间： 2023-05-06
外交部发言人敦促美方停止售台武器和美台军事联系全球新动态

时间： 2023-05-06
缓解负债端压力多家银行下调存款利率

时间： 2023-05-06
高拉特：我还是中国籍，但已经在等恢复巴西国籍的文件

时间： 2023-05-06
天天快播：五一民航市场量价齐升：航司看好暑运或加速全年扭亏为盈

时间： 2023-05-06
当前速讯：生牛肉怎么煮容易烂?

时间： 2023-05-06
微信买股票手续费怎么算_买股票手续费怎么算|天天热门

时间： 2023-05-06
北京快捷酒店官网预订_北京快捷酒店

时间： 2023-05-06
农业农村部部署2023年扩大农业农村有效投资工作要求进一步加强投融资模式创新|全球快看点

时间： 2023-05-06
触动心灵的人和事800字作文（触动心灵的人和事800）

时间： 2023-05-06
股票行情快报：正和生态（605069）5月5日主力资金净卖出74.67万元焦点热讯

时间： 2023-05-06
33轮竞价溢价30％！安阳市2.1亿元出让两宗宅地

时间： 2023-05-05
减肥可以吃锅盔吗? 独家焦点

时间： 2023-05-05
【五四特别致敬·我还是从前那个少年】五四青年节听他们说......

时间： 2023-05-05
研究：美国少数族裔新冠死亡率仍居高不下

时间： 2023-05-05
茂名市司法局_关于茂名市司法局的简介-快讯

时间： 2023-05-05
山东71岁爷爷一年2次外出卖糖具体详细内容是什么|环球速读

时间： 2023-05-05
旅法大熊猫“圆梦”将于7月4日回国

时间： 2023-05-05
江苏金租董事、总经理张义勤辞职

时间： 2023-05-05
【环球快播报】当日快讯：巴西副总统参观长城汽车巴西新能源工厂，后者明年启动运营

时间： 2023-05-05
热点在线丨2.2万余名志愿者“五一”护航游云南

时间： 2023-05-05
茂名市十届人大常委会第三次会议_关于茂名市十届人大常委会第三次会议的简介

时间： 2023-05-05
湖北人五一假期青睐家门口“微度假”

时间： 2023-05-05
文化和旅游部推出10条长江主题国家级旅游线路-当前要闻

时间： 2023-05-05
当前聚焦：海南融担机构来访协会交流座谈

时间： 2023-05-05
全球球精选！当日快讯：5月总票房破10亿

时间： 2023-05-05
报道：云霄县审计局到绥东社区宣传“文明创城”活动

时间： 2023-05-05
天天微头条丨【青春中国】时代向前青年向上！

时间： 2023-05-05
要闻速递：汽车上那些让人拍案叫绝的巧妙设计，知道两条就算高手了

时间： 2023-05-05
天天消息！这个五一，买买买起来~

时间： 2023-05-05
世界速递！欧盟警告苹果不准加密USB-C接口：就是硬气

时间： 2023-05-05
在线时间校准同步毫秒_在线时间校准同步

时间： 2023-05-05
科幻惊悚游戏《无敌号》 Steam开启试玩Demo下载天天日报

时间： 2023-05-05
世界热推荐：会战红色家谱 | 我结婚，我不在场

时间： 2023-05-05
俄外交部谈克宫遇袭美英和北约应为乌克兰政府的行为负责佩斯科夫回应克宫遭袭称基辅受美国指使选择袭击目标

时间： 2023-05-05
焦点热议:11部门联合发文加强医美监管

时间： 2023-05-05
环球滚动:合锻智能：一季度扣非后净利润与上年同期差距不大，营收差额在于一季度受市场环境影响，公司产品发货及验收有所延后导致

时间： 2023-05-05
每日讯息!现货黄金价格创历史新高消费者购金热情不减

时间： 2023-05-05
今日报丨华懋科技董事长袁晋清：瞄准“全球领先” 奏出事业华章

时间： 2023-05-05
【环球热闻】大布夫妇在红毯上狂秀恩爱！妮可拉戴94克拉项链闪耀，比明星还美

时间： 2023-05-05
当前快报:今日2只新股上市：创业板三博脑科、科创板晶合集成

时间： 2023-05-05
安岳三姐弟溺亡，母亲被打进医院，事发时孩子父亲在打牌! 讯息

时间： 2023-05-05
7岁地包天矫正得多少钱_地包天矫正得多少钱-全球视点

时间： 2023-05-05
御狐神双炽介绍_御狐神双炽当前滚动

时间： 2023-05-05
22分13板4助！扛起深圳大旗，倾其所有赢得尊重，让浙江男篮胆寒天天快播

时间： 2023-05-05
三湘银行累计投放产业贷款超2300亿元_当前最新

时间： 2023-05-04
世界热推荐：初灵信息：收到浙江证监局警示函

时间： 2023-05-04
环球观察：索菲亚：获景顺投资管理有限公司等举牌

时间： 2023-05-04
焦点热门:五年级父母的爱作文

时间： 2023-05-04
【世界报资讯】互联网平台、数字人民币来助力 “五一”假期消费数据来了！你贡献了多少

时间： 2023-05-04
世界快消息！桃源县教仁学校举行第六届“渔父杯”青年教师专业素养大赛

时间： 2023-05-04
今日热搜：5月4日金巧福珠宝黄金607元/克铂金447元/克

时间： 2023-05-04
快讯：奇迹mu无限钻石9999推荐奇迹mu无限钻石9999手游合集

时间： 2023-05-04
线上线下齐发力家电消费科技含量递增

时间： 2023-05-04
世界新消息丨美国军火大佬坠亡，谁关掉了发动机？

时间： 2023-05-04
AWE2023:智能卫浴正加速普及,成为消费级热点_环球播资讯

时间： 2023-05-04
中华企业挂牌转让子公司申阳滨江75%的股权及相关债权当前速讯

时间： 2023-05-04
新华社权威快报丨2023年“五一”假期全国营业性客运量合计26971.6万人次天天要闻

时间： 2023-05-04
89元起入手微软授权手柄，八位堂发布猎户座青春版手柄每日快播

时间： 2023-05-04
中牟景区：文明旅游成为亮丽风景-全球热文

时间： 2023-05-04
每日报道：淄博烧烤老板从门洞露脸问人多不多，被客流量吓到不敢开门

时间： 2023-05-04
四川雅安市石棉县发生3.3级地震

时间： 2023-05-04
空调除湿模式是什么意思_空调除湿模式头条

时间： 2023-05-04
赣榆秦山岛马拉松、游泳精彩开赛每日热闻

时间： 2023-05-04
惊爆游戏无修版百度网盘（惊爆游戏无修版）-环球微头条

时间： 2023-05-04
成都新世纪外国语学校2023年小一和初一新生招生简章发布！-焦点消息

时间： 2023-05-04
工信部：一季度规模以上电子信息制造业增加值同比下降1.1%

时间： 2023-05-04
三国杀online百度一区_三国杀online-全球观点

时间： 2023-05-04
【环球新视野】英雄联盟战斗力怎么提升才快啊下面就来看看吧

时间： 2023-05-04
世界今热点：4月财新中国制造业采购经理人指数（PMI）录得49.5

时间： 2023-05-04
当前播报:【能源广角】着力破解绿氢输送难题

时间： 2023-05-04
欣贺股份5月4日快速反弹|世界快播

时间： 2023-05-04
钢研高纳（300034）4月28日主力资金净卖出754.07万元_当前快播

时间： 2023-05-04
环球动态:从AWE的新品嬗变看家电行业“风往哪里吹”

时间： 2023-05-04
【机构调研记录】中加基金调研慕思股份、怡合达

时间： 2023-05-04
环球快报:“聊天”就可规划旅程：Expedi的ChatGPT之道

时间： 2023-05-04
世界微动态丨每日金选｜天音股份一季度净利润同比增超6倍；天齐锂业一季度净利同比增长46.49%；九安医疗一季度净利同比降95.8%；得利斯在淄博开展行销推广活动

时间： 2023-05-04
环球今日报丨国星光电：公司自主开发的AI智能语音模式产品已应用于家电领域并实现量产

时间： 2023-05-04
环球视讯！中国民办教育学生信息网_民教网_中国民办教育学生信息网

时间： 2023-05-04
环球视点！2010年7月思想汇报_2010年7月思想汇报

时间： 2023-05-03
全球观点：五一航空市场收官：航班量超过2019年同期高景气度有望延续

时间： 2023-05-03
世界微动态丨面试季，太狠了！！！

时间： 2023-05-03
环球信息:“五一”假期全国营业性演出票房收入15.19亿元

时间： 2023-05-03