Open AI 发布 GPT4:一种可以理解图像和文本的超级人工智能
admin
2023-10-22 02:40:27
0

就在今天凌晨 Open AI 发布了全新的人工智能技术 GPT4,能够同时处理图像和文本


什么是 Open AI


Open AI 是一家致力于推动人工智能发展和应用的非营利组织,由众多知名科技人士和企业家联合创立,旨在创建可以与人类合作和竞争的通用人工智能(AGI)。近日,Open AI 宣布了其最新的人工智能技术 GPT4(Generative Pre-trained Transformer 4),这是一种大型多模态模型(可以接受图像和文本输入,并输出文本),在各种专业和学术领域展现出了与人类水平相当甚至超越的表现。


什么是 GPT-4


GPT4 是 Open AI 旗下 GPT 系列模型的最新成果,之前他们已经出过 GPT、GPT2、GPT3 和 GPT3.5 这几个版本。GPT 系列模型都是基于深度学习技术搞出来的大规模语言模型,可以吸收海量数据进行预训练,并在不同任务上进行微调或零样本学习。GPT 系列模型在自然语言处理领域引起了轰动,并产生了很多火爆的应用,比如 ChatGPT、DALL-E 等。

图像输入支持


跟前几代模型相比,GPT4 的最大亮点之一是增加了对图像输入的支持,使得它可以同时理解图像和文本信息,并根据用户需求生成相应内容。比如,在 ChatGPT 中,用户可以上传图片并让 GPT4 根据图片生成描述、标题、故事等;




演示 Demo


通过下方的 Demo 视频,我们可以看到用户通过手绘画了一页网站的原型图。

之后通过手机将图片拍照再发给 GPT-4 ,让 GPT-4 基于这份图片生成一个 HTML 代码。

最后用户使用这个 HTML 代码,真的实现了一个网页的效果。




https://www.zhihu.com/video/1619258665889669120


创造性提升


除此之外,GPT4 还在复杂性、创造性和灵活性方面有所提升,能够处理更多样化和高难度的任务。比如,在 ChatGPT 中,用户可以让 GPT4 生成、编辑或迭代各种创意或技术写作任务,如编写歌曲、剧本或学习用户风格等;或者用户可以向 GPT4 提出各种问题,并得到详尽且准确地回答;或者用户可以与 GPT4 进行有趣且富有逻辑地对话。




应对考试


为了验证 GPT4 的能力,在没有针对性训练地情况下,Open AI 让它参加了一些原本设计给人类地考试,并取得了惊人地成绩。比如,在美国律师资格考试中,GPT4 的分数位于前 10% 左右;而上一代模型 GPT3.5 的分数则位于后 10% 左右。还有,在其他诸如奥林匹克竞赛、AP 课程等考试中,GPT4 也都展现出了与人类水平相当甚至超越地表现。

Open AI 说,GPT4 的成功离不开其在深度学习技术方面地不懈探索和创新。在过去两年中,Open AI 重建了其整个深度学习栈,并与微软 Azure 共同从零开始设计了一台专门针对其工作负载地超级计算机。一年前,Open AI 以 GPT3.5 作为该系统地第一次“试运行”,并发现并修复了一些错误,并改进了其理论基础。因此,GPT4 的训练过程非常稳定,并且能够提前准确预测其训练效果。

提高安全性和可控性


除了提升 GPT4 的能力外,Open AI 还花费了六个月地时间来提高 GPT4 的安全性和可控性。通过借鉴其对抗测试计划和 ChatGPT 的经验,Open AI 在各种内部评估中使得 GPT4 在事实性、可引导性和拒绝超出边界地内容方面都取得了最佳结果(尽管依旧不完美)。比如,在回应禁止内容地请求时,GPT4 比 GPT3.5 少出现了 82%;在产生事实性回应时,GPT4 比 GPT3.5 多出现了 40%。




需要加入等待清单


目前,Open AI 已经通过 ChatGPT 和 API(等待名单)向公众开放了 GPT4 地文本输入功能。为了准备图像输入功能地更广泛可用性,Open AI 目前正在与一个合作伙伴紧密合作。同时,Open AI 还开源了 OpenAI Evals,这是一个用于自动评估人工智能模型性能地框架,以便任何人都可以报告模型地缺陷以帮助指导进一步改进。

New Bing 也要接入 GPT-4


据说,在发布 GPT4 后不久,微软就宣布将使用 GPT4 来为其必应搜索引擎提供更智能和友好地聊天功能,并已经在部分国家和地区进行测试。




Open AI 表示,GPT4 只是他们通往通用人工智能地一个里程碑,他们还会继续努力,不断改进和创新,为人类带来更多有价值和有意义地人工智能产品和服务。


END


我是李祺,微软 Power Platform 方向 MVP ,2014 年进入开发领域,了解微软云全系产品。2020 年以来专注在 Power Platform 领域,曾为微软和多家客户提供售前、培训和实施服务。为普及产品知识,帮助国内用户快速上手。从 2021 年开始创建个人公众号和知乎【李祺 Varman】,目前已提供 200+ Power Platform 中文学习资料,欢迎大家进入公众号菜单【问答社区】进行问题咨询。

相关内容