生成式AI与提示词工程
乱写的。在 AI 相关资讯铺天盖地的当下记录一下自己的想法。
还记得 16 年高中毕业前,AI 因为 Alpha Go 大火,也成为了当时的三位一体/自主招生的常见面试题,为此我还特意找了一堆资料来看(其中还包括已经被我渐渐遗忘的《电脑报》)。那时我应对 AI 相关问题的论调是,因为还没有通用型 AI,所以离威胁人类还很遥远。
ChatGPT 的震撼之处在于它的覆盖面极广(或者说能从庞大的语料库中有效提取出信息),让我感到通用 AI 已经近在眼前了,而我也愿意把 ChatGPT 加入我的日常 workflow 里。在此之前我也有尝试过别的生成式 AI,比如根据提示词写故事和绘画的,虽然效果好又很有趣,但我不会把它们和我的日常生活结合起来。再之前,AI 在某些方面已经做到近乎完美了,比如识别车牌和人脸,但是我只是在被动地使用它们。此外 GPT 这类大模型 AI 的可塑性还很好,可以通过 finetune 来获得新的应用场景。比如 ChatGPT 在理解对话上已经很好了,再用 3D 模型和对应的描述去追加训练 ChatGPT 的模型,就能获得一个能用自然语言创造出 3D 模型的 AI 了。作为热爱游戏的我能想象到在不久的将来,开放世界游戏以一种框架的形式出现,玩家可以通过 AI 来创建剧本、场景、角色等内容,而创建出的 NPC 也可以 AI 的加持下与玩家自由互动。
对于 AI 生成的内容 (AI-generated content,简称 AIGC),质量也是有好坏差异的,通过精心挑选提示词来低成本地从 AI 那里得到你想要的东西,这样的“艺术”被称为 prompt engineer(提示词工程)。可以用搜索来类比,为了提升搜索结果第一页的相关度,需要有技巧地组织搜索框里的关键词,比如“AA BB 位置”很可能优于“怎么才能在 AA 里找到 BB?”(甚至能省下几次击键次数)。我一直相信很快会诞生一个名为 prompt engineer(提示词工程)的职业。而在几天前文心一言的发布会上,百度 CEO 李彦宏表示十年后有 50% 的工作会是 prompt engineer,不会写 prompt 人会被淘汰。我觉得这有些太过夸张了,因为 prompt engineer 也是需要创造力以及领域知识的,可以胜任的人远没有一半。况且如果写 prompt 的过程本身不需要创造力的话,又很快会被 AI 取代。
最后稍微写写我关于 AI 的一些担忧吧:
- AIGC 压制原创,看什么东西都像是 AI 创作的,事实上绝大多数也是如此。
- 只有少数政府或者机构能拥有超大模型 AI,先进 AI 成为了少数人的特权。
- 人们沉溺在 AIGC 中,算法生成比算法推荐能更完美地适应人们的精神需求。