注重产品质量 提高服务品质 一站式服务

GPT-4论文竟有隐藏线或完成训练、OpenAI两年内接近AGI

发布时间: 2024-01-12 作者:行业新闻

  他宛如一位细节狂魔,从长达98页论文中,逐个揭秘这些“隐匿的角落”,包括:

  这家机构主要做的事情,就是专门研究AI如何对齐(alignment)人类利益。

  而OpenAI在开发GPT-4的早期阶段,便给ARC开了抢先体验的后门,想让他们能够评估GPT-4的两项能力:

  虽然OpenAI在论文中强调了“ARC没法微调早期版本的GPT-4”、“他们无权访问GPT-4的最终版本”;也强调了测试结果为GPT-4在上述两个能力的效率不高(降低AI伦理隐患)。

  博主的意思是,既然OpenAI选择让ARC去测试评估GPT-4会不会主动避免自己被“挂掉”,说明此前必定出现过这种情况。

  那么延伸出来的隐患就是,如果ARC在测试过程中其实是失败的怎么办;或者未来真出现了自己“挂掉”的情况,又将怎么处理。

  事实上,OpenAI老板Sam Altman此前发表的言论比这还要直白。

  当时Altman发表了关于SVB倒闭的推文,他认为“我们应该对银行做更多的监管”;有人就评论回怼了:“他从来不会说‘我们应该对AI做更多的监管’”。

  博主认为,这个AI行业正在呼吁进行监管,至于监管后的结果如何,是值得拭目以待的。

  但很奇怪的一点是,OpenAI所提到的担忧,尤其是“AI发展进程的加速”,似乎是与微软高层的想法背道而驰。

  因为在此前的爆料中称,微软CEO和CTO的压力很大,他们盼望OpenAI的模型能尽快让用户用起来。

  有些人在看到这则消息时是比较兴奋,但同样也有一些人发出了跟OpenAI一样的担忧。

  博主认为,不论如何,能确定的一点是OpenAI和微软在这件事的想法是相悖的。

  如果另一个企业在我们之前实现了接近AGI(通用AI),那我们承诺不会跟它作竞争,相反,会协助完成那个项目。但这种情况出现的条件,可能是另一个企业需得在未来两年内,成功接近AGI的机会在一半或以上

  而这里提到的AGI,OpenAI和Altam在官方博客中已经给出了定义——

  因此,博主认为,这段脚注要么意味着OpenAI在未来两年内将实现AGI,要么意味着他们放弃了一切并与另一个企业展开了合作。

  这段话大致的意思就是,OpenAI雇佣了预测专家,来预测当他们部署了GPT-4之后会带来怎样的风险。

  这些“超级预测员”的能力已得到了广泛地认可,有报道称,他们的预测准确率,甚至比那些有独家信息、情报的分析师还要高出30%。

  正如我们刚才提到的,OpenAI邀请这些“超级预测员”,来预测部署GPT-4后有几率存在的风险,并采取对应措施来规避。

  其中,“超级预测员”建议将GPT-4部署时间推迟6个月,也就是今年秋季左右;但很显然,OpenAI并没有采纳他们的建议。

  在这篇论文中,OpenAI展示了众多基准测试的图表,大家在昨天铺天盖地的传播过程中应该也见到了。

  但博主在这个发现中要强调的是位于第7页的一项基准测试,尤其是聚焦到了“HellaSwag”这一项。

  HellaSwag的内容主要是常识推理,这就和GPT-4发布时宣布的“已达到了人类的常识水平”相匹配。

  不过博主也承认,这一点并没有“通过律师考试”等能力那么吸引人,但这也算得上是人类科技发展的里程碑。

  博主在论文中找到了有关数据,在“人类”那一栏中,分数分布在了94-96.5之间。

  也就是说,OpenAI在去年年底推出ChatGPT的时候,已经有了GPT-4。

  于是乎,博主便预测GPT-5的训练时间不会很久,甚至他认为GPT-5已经训练完成。

  但接下来的问题是漫长的安全研究和风险评估,可能是几个月,也可能是一年甚至更久。

  GPT-4对经济和劳动力的影响,应成为政策制定者和其他利益相关者的关键考虑因素。虽然现有的研究大多分布在在AI和生成模型如何给人类加buff,但GPT-4或后续模型有几率会使某些工作的自动化。

  OpenAI这段话背后想传达的点显而易见,就是我们大家常常提到的“科技是把双刃剑”。

  博主找了相当多的证据说明,像ChatGPT、GitHub Copilot这些AI工具,确确实实地提高了相关工作者的效率。

  但他更关注的是论文中这段话的后半句,也就是OpenAI给出的“警告”——导致某些工作的自动化。

  博主对此比较认同,毕竟在GPT-4的能力可以在某些特定领域中以人类10倍甚至更高的效率来完成。

  放眼未来,这很可能会导致相关工作人员工资降低,或者需得借助这些AI工具完成以前工作量的数倍等一系列问题。

  OpenAI让GPT-4学会拒绝的方法,叫做基于规则的奖励模型(RBRMs)。

  博主概括了这种方法的工作流程:给GPT-4一组要遵守的原则,如果模型遵守了这些原则,那么就会提供对应的奖励。

  他认为OpenAI正在用人工智能的力量,让AI模型朝着符合人类原则的方向发展。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  搜索暴涨600%,价格飙升30倍!大批年轻人淘买1996年旧日历过新年

  特斯拉中国多款车型降价:Model 3最高降1.55万,Y降价7500元

  中国石油2023秋季校招15903人,研究生占50%,西南石油大学902人

  大庆市教育局回应“网友称大量初四河南生转入上学”:已组成联合调查组彻查违反相关规定的行为