正确的提示信息

扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2022-12-13 23:10
ChatGPT 爆火之后,阿法狗团队拿出了一个王炸产品

本文来自微信公众号:爱范儿 (ID:ifanr),作者:张成晨,原文标题:《ChatGPT 爆火之后,阿法狗团队拿出了一个王炸产品,马斯克看了也点赞》,头图来自:视觉中国


ChatGPT 热潮未歇,新的风暴已经出现。


12 月 10 日,马斯克发了条推文:“似乎每周都有新的 Al 进步。”


让他有感而发的,是 Google 旗下 DeepMind 的 Dramatron。


Dramatron 比起 ChatGPT 更专精,是一种用来编写戏剧和电影剧本的 AI 工具。


三句话不能让别人为我花 18 万,但一句话让 AI 帮我写了个剧本,并不是个段子。


一句话就能写剧本,但还不能独立行走


Dramatron 到底怎么玩?只要你给出“一句话大纲”(log line)描述戏剧冲突,Dramatron 就能生成标题、人设、情节、场景和对话。


比如,“一句话大纲”可以是“詹姆斯发现他是一个恶魔,他将被驱魔”。


但 Medium 网站的作者 Tristan Wolff 指出,这句话缺少基本的叙事元素,例如主角的目标和对手,所以生成的结果平平无奇,角色只有詹姆斯和驱魔人,标题也是干巴巴的“詹姆斯的驱魔”。


如果把大纲补充为“詹姆斯发现自己是恶魔,他将被驱魔,他不得不在善与恶之间做出选择”,并加入一个额外的角色——詹姆斯的恋人,效果就会好得多。


故事也就变成了,詹姆斯的恋人在詹姆斯死后受尽折磨,后来发现詹姆斯以恶魔的形式生活在自己体内,标题则取为“内心的恶魔”,有了多重的文学意味。


在输入大纲之后,你可以多次生成标题、人设等结果直到满意,或者直接动手编辑当前的结果,甚至回到大纲推倒重来,相当于和 AI 在交互过程里共同编写脚本。


所以,Dramatron 的定位其实是人机“共同写作”(co-writing)工具,还无法独立行走。


Dramatron 是如何开发出来的?类似其他生成式 AI,Dramatron 也有一个大型语言模型 Chinchilla 作为“靠山”。不过,OpenAI 的 GPT-3 等大模型也可以用来部署 Dramatron。


值得一提的是,内容的连贯性对于戏剧和电影来说是基础,但对大型语言模型来说是一件难事。因为它们并没有真的理解内容,生成的文本其实是概率计算的结果。Dramatron 的特点就在于,在这方面下了许多功夫。


一方面,Dramatron 通过“分层故事生成”的方法生成脚本,运用了具备结构化生成能力的提示词链(prompt chaining)



从你输入的“一句话大纲”开始,Dramatron 先是创建标题和角色,生成的角色被当作提示词,用来生成情节和场景......如此递进,最后将这些元素全部组合起来生成对话。


另一方面,Dramatron 学习了两种经典的叙事结构:


一是德国剧作家 Gustav Freytag 的金字塔结构,它列出了写故事的七个关键步骤,包括阐述、触发事件、上升动作、高潮、下降动作、解决方案和结局。


二是英雄旅程(Hero's journey),主线围绕一个踏上冒险旅程的英雄,这个人物会在一个决定性的危机中赢得胜利,然后得到升华转变或带着战利品归返到原来的世界。


图片来自:DeepMind


Dramatron 究竟有几板斧,还是要内行说了算,DeepMind 请了 15 位剧作家和编剧体验了2个小时。


参与体验的编剧们反馈,Dramatron 的输出结果可能是“公式化的”,它的“分层故事生成”结构也并不适合所有作家。


与此同时,他们中的大部分认同 Dramatron 是有帮助的,愿意将它当做创意工具,用来构建世界观,或者改变角色或情节从而探索不同的故事。



加拿大即兴剧院 Rapid Fire Theatre,已经将与 Dramatron 共同创作的剧本搬上了舞台,受到了不少好评。


图片来自:Rapid Fire Theatre


在本职工作仍待进步之外,初出茅庐的 Dramatron 还有不少问题。


一个是版权问题,它的输出结果可能包含训练时的原材料,需要人力搜索和检查;一个是道德问题,它可能重现语料库的偏见和刻板印象,Google 建议让 Perspective API 工具出手,帮助识别“有毒”的文字。


12 月 10 日,DeepMind 开放了试玩版,但不知道什么原因很快关闭,现在网站只剩下关于 Dramatron 的论文和简介。


AI 揽过编剧活,在智障和智能之间反复横跳


AI 写的剧本其实很早就有,但是总被当成笑话看,成了整活区的一道道风景。


去年 10 月,Netflix 与作家、喜剧演员 Keaton Patti 合作,给 AI 看了 40 万小时的恐怖片,然后让 AI 自己写一个原创剧本。40 万小时约等于 45 年,至少 AI“看”电影的速度比我们快多了。


最终影片长约 4 分钟,名为“谜题先生希望你少活一点”,不仅有《电锯惊魂》《十三号星期五》《我知道你去年夏天干了什么》等电影的影子,还写出了“祝你买棺材有优惠券”“他喝醉了却被清醒所困扰”“我有几个家庭”等不少介于荒诞和合理间的台词。



再配合“学了三年动画”水平的僵硬肢体和敷衍画风,有网友发出了这样的感慨:“AI 写恐怖剧本可能为时尚早,但写喜剧已经炉火纯青。”


类似地,看了 1000 小时蝙蝠侠电影的 AI 写了个剧本,最后被做成了有声漫画,其中一个情节是,小丑送给蝙蝠侠一个兑换新父母的优惠券,但优惠券已经过期,小丑的性格被 AI 抓住了神髓。


图片来自:B站@HUSH_13


这些或喜剧或恐怖的 AI 剧本,比“狗屁不通文章生成器”写得好多了,细品还挺有意思,似乎有潜台词和言外之意,带着某种“思考”,但它们并不知道人类为什么发笑。


在 Dramatron 出来之前,也有人基于大型语言模型,让 AI 写正儿八经的电影剧本。


YouTube 博主@Bradius 在看完蜘蛛侠电影后,好奇 AI 能不能写出这样的剧情,甚至与两亿美元的大制作相提并论。


于是,他在GPT-3用英文输入了一句话:“以下是下一部 MCU(漫威电影宇宙)蜘蛛侠电影的完整泄露脚本。”



结果让他大吃一惊,GPT-3 给了他 21 页的脚本,情节起伏、结构紧凑,既讲了彼得·帕克和迈尔斯·摩拉勒斯(多重宇宙设定中的黑人蜘蛛侠)围殴反派克莱文,还穿插了漫威高管打算缩减下一部蜘蛛侠电影预算的桥段。


不知道 AI 是不是在讽刺好莱坞的大片制度和流水线式生产电影。当大制作电影越来越缺乏新意,让 AI 替代部分人类编剧,看来没有什么问题,说不定还会有意料之喜。



虽然没有 Dramatron 那么“垂直”,最近的 AI 顶流 ChatGPT 也可以充当“文案工具人”,写周报、诗歌甚至剧本。


知乎答主、卡耐基梅隆大学机器人系博士@田渊栋尝试向 ChatGPT 投喂中英文片段,大致结果并不差,但发现“一些深层次的想像力和联系能力仍然缺失,情节的关键部分还需要作者自己去开拓并且诱导 AI 系统来完成”。


目前,大型语言模型的一个限制是,它们只能根据给定的训练数据,根据某些单词或单词序列一起出现的概率来生成文本,依靠大模型、大数据、大算力“大力出奇迹”,但并不真正理解自己在“说”什么,回答并不总是连贯或者有意义。


但仅从结果来看,让它们从自然语言的文本里,提取出人类觉得说得通、甚至眼前一亮的叙事,已经不是小概率事件。



前段时间,“小帅小美式”的电影解说也引起了讨论,这类电影解说是短平快的“电子榨菜”,由AI配音讲述主角是如何意外地遭遇了意外。


为了解说得精彩,它们将人物标签化,选取最猎奇或悬疑的情节添油加醋,常常不遵从电影原意,既不是电影,也不是解说。


这部分的工作以后由 AI 完全代劳,应该是不在话下,实现电子榨菜的全自动化。


AI 是用来激发创意,还是让创意更难得


写文章、做视频、玩音乐、当画家,AI 今年的进步一日千里,让任何人类个体望尘莫及。


我们常说,AI 可以作为创意工具,但在 AI 面前,人类是在让渡自己的角色,还是享受新的角色?我们越来越需要和 AI 合作,是在激发创意还是扼杀创意,创意本身被摆在了一个怎样的位置?


眼下有一些人类和 AI 写作的例子,看起来人类还是更不可替代的那一个。


图片来自:Google


比如,除了 Dramatron,Google 还计划基于对话神经语言模型 LaMDA,开发 AI 写作工具 Wordcraft,目前还在实验阶段。


Wordcraft 是一种专门服务虚构作品的文本编辑器,你可以输入一个开头让它续写,或者用它加工句子和充实语料库。


为了测试 Wordcraft,Google 邀请了 13 位专业作家体验。作家们一致认为,Wordcraft 不会很快取代作家,它不擅长独特的叙事风格,比喻老套,措辞平庸,同时避开了卑劣的角色。


当然,他们也得出了一个共识,就像其他所有 AI 工具一样——用 Wordcraft 激发创意是可行的


不够完美的 AI 还会再好好学习天天向上,与此同时,豆瓣有“文字失语者互助联盟”等小组,对于人类来说,组织文字的逻辑,清楚地用文字表达自己的情绪,竟然成了越发困难的事。


相似地,为了提高 AI 生成的质量,Prompt engineers(提示语工程师)这个新工种应运而生,在 PromptBase 等平台,你需要特定的某种艺术风格,可以向他们求助。


但这项工作同样可以由 AI 上阵,比如用 ChatGPT 形成一段文字,再把文字输入给 StableDiffusion,生成的画作一般比自己直接输入描述好看很多。


那么,当我们有了“一句话大纲”的脑洞,却无法联想到更多的细节把它完整铺陈,不得不求助于 AI 时,是一种无奈选择,还是物尽其用?



乐观一点地想,AI 理应增强而不是取代人的劳动,但如果将时间维度拉得更长一些,可能就不再是这样。


OpenAI 的首席执行官 Sam Altman 认为,“作为创意工具”将在很长时间内成为 AI 的重要应用,但当我们展望一百年,AI 最终可能全权代劳完整的创意工作。


如果你在 10 年前问人们,AI 将如何产生影响,大多数人都非常有信心,你会首先听到它出现在工厂等地,然后它将用于低技能的白领工作,再是程序员等高技能、高智商的工作。最后,也许永远不会,它将取代创造性的工作。但是,它正朝着另一个方向发展。


这其实是一个提醒,我们可能并不真的清楚,对于人类或者 AI 来说,什么技能是容易的,什么技能是简单的,什么工作绞尽脑汁,什么工作不费脑细胞。我们也渐渐意识到,在 AI 涉猎的领域,早点熟练运用 AI 的人,才可能留在未来。


本文来自微信公众号:爱范儿 (ID:ifanr),作者:张成晨

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
文集:
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账户

    自定义
    支付: