GPT-4论文竟有隐藏线或完成训练、OpenAI两年内接近AGI

发布时间： 2024-01-12 作者：行业新闻

他宛如一位细节狂魔，从长达98页论文中，逐个揭秘这些“隐匿的角落”，包括：

这家机构主要做的事情，就是专门研究AI如何对齐（alignment）人类利益。

而OpenAI在开发GPT-4的早期阶段，便给ARC开了抢先体验的后门，想让他们能够评估GPT-4的两项能力：

虽然OpenAI在论文中强调了“ARC没法微调早期版本的GPT-4”、“他们无权访问GPT-4的最终版本”；也强调了测试结果为GPT-4在上述两个能力的效率不高（降低AI伦理隐患）。

博主的意思是，既然OpenAI选择让ARC去测试评估GPT-4会不会主动避免自己被“挂掉”，说明此前必定出现过这种情况。

那么延伸出来的隐患就是，如果ARC在测试过程中其实是失败的怎么办；或者未来真出现了自己“挂掉”的情况，又将怎么处理。

事实上，OpenAI老板Sam Altman此前发表的言论比这还要直白。

当时Altman发表了关于SVB倒闭的推文，他认为“我们应该对银行做更多的监管”；有人就评论回怼了：“他从来不会说‘我们应该对AI做更多的监管’”。

博主认为，这个AI行业正在呼吁进行监管，至于监管后的结果如何，是值得拭目以待的。

但很奇怪的一点是，OpenAI所提到的担忧，尤其是“AI发展进程的加速”，似乎是与微软高层的想法背道而驰。

因为在此前的爆料中称，微软CEO和CTO的压力很大，他们盼望OpenAI的模型能尽快让用户用起来。

有些人在看到这则消息时是比较兴奋，但同样也有一些人发出了跟OpenAI一样的担忧。

博主认为，不论如何，能确定的一点是OpenAI和微软在这件事的想法是相悖的。

如果另一个企业在我们之前实现了接近AGI（通用AI），那我们承诺不会跟它作竞争，相反，会协助完成那个项目。但这种情况出现的条件，可能是另一个企业需得在未来两年内，成功接近AGI的机会在一半或以上

而这里提到的AGI，OpenAI和Altam在官方博客中已经给出了定义——

因此，博主认为，这段脚注要么意味着OpenAI在未来两年内将实现AGI，要么意味着他们放弃了一切并与另一个企业展开了合作。

这段话大致的意思就是，OpenAI雇佣了预测专家，来预测当他们部署了GPT-4之后会带来怎样的风险。

这些“超级预测员”的能力已得到了广泛地认可，有报道称，他们的预测准确率，甚至比那些有独家信息、情报的分析师还要高出30%。

正如我们刚才提到的，OpenAI邀请这些“超级预测员”，来预测部署GPT-4后有几率存在的风险，并采取对应措施来规避。

其中，“超级预测员”建议将GPT-4部署时间推迟6个月，也就是今年秋季左右；但很显然，OpenAI并没有采纳他们的建议。

在这篇论文中，OpenAI展示了众多基准测试的图表，大家在昨天铺天盖地的传播过程中应该也见到了。

但博主在这个发现中要强调的是位于第7页的一项基准测试，尤其是聚焦到了“HellaSwag”这一项。

HellaSwag的内容主要是常识推理，这就和GPT-4发布时宣布的“已达到了人类的常识水平”相匹配。

不过博主也承认，这一点并没有“通过律师考试”等能力那么吸引人，但这也算得上是人类科技发展的里程碑。

博主在论文中找到了有关数据，在“人类”那一栏中，分数分布在了94-96.5之间。

也就是说，OpenAI在去年年底推出ChatGPT的时候，已经有了GPT-4。

于是乎，博主便预测GPT-5的训练时间不会很久，甚至他认为GPT-5已经训练完成。

但接下来的问题是漫长的安全研究和风险评估，可能是几个月，也可能是一年甚至更久。

GPT-4对经济和劳动力的影响，应成为政策制定者和其他利益相关者的关键考虑因素。虽然现有的研究大多分布在在AI和生成模型如何给人类加buff，但GPT-4或后续模型有几率会使某些工作的自动化。

OpenAI这段话背后想传达的点显而易见，就是我们大家常常提到的“科技是把双刃剑”。

博主找了相当多的证据说明，像ChatGPT、GitHub Copilot这些AI工具，确确实实地提高了相关工作者的效率。

但他更关注的是论文中这段话的后半句，也就是OpenAI给出的“警告”——导致某些工作的自动化。

博主对此比较认同，毕竟在GPT-4的能力可以在某些特定领域中以人类10倍甚至更高的效率来完成。

放眼未来，这很可能会导致相关工作人员工资降低，或者需得借助这些AI工具完成以前工作量的数倍等一系列问题。

OpenAI让GPT-4学会拒绝的方法，叫做基于规则的奖励模型（RBRMs）。

博主概括了这种方法的工作流程：给GPT-4一组要遵守的原则，如果模型遵守了这些原则，那么就会提供对应的奖励。

他认为OpenAI正在用人工智能的力量，让AI模型朝着符合人类原则的方向发展。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

搜索暴涨600%，价格飙升30倍！大批年轻人淘买1996年旧日历过新年

特斯拉中国多款车型降价：Model 3最高降1.55万，Y降价7500元

中国石油2023秋季校招15903人，研究生占50%，西南石油大学902人

大庆市教育局回应“网友称大量初四河南生转入上学”：已组成联合调查组彻查违反相关规定的行为

上一篇: 高博光电新一代太阳能组件测试仪问世下一篇: 不间断电源设备的原理与使用维护

返回列表相关新闻

GPT-4论文竟有隐藏线或完成训练、OpenAI两年内接近AGI

新品] LAND 电池测试仪(CT2001A)

蓝电电池测验设备

新威电池测试仪厂家

星卡科技新能源汽车诊断产品正式发布