5.1.3
// 5.1.3.md
5.1 P之简史:从逻辑符号到概率统计
5.1.3 我与GPT的“龙虎之缘”:一扇门被悄然推开
请允许我在这里,稍稍放慢脚步,与你分享一段属于我自己的、与GPT的结缘的往事。
那是在2021年,一个在人工智能的历史长河中,既不算遥远,却又恍如隔世的年份。
那时的AI江湖,聚光灯大多还打在BERT那样的“名门正派”身上,擅长当时时兴的文本分类、实体抽取、舆情监测、机器翻译等等任务,点亮了那个时代。
而那个在今天看来参数小得有些可怜的GPT-2,则更像个山里的野孩子,不成体系,偶有惊艳之语,但远非主流。我当时也就是闲着没事,出于对古诗词的瞎喜欢,弄了几万首诗词对联,交给了改造过支持中文的GPT-2,看它是否理解唐风宋韵。
花了2天时间,在A5000上训练了10个轮次。然后我在命令行中里敲下了一句简单的上联:
“一二三四五,上山打老虎”
几秒钟后,一行字浮现在屏幕上。
“东西南北中,下海擒苍龙”
我当时就愣住了,半天没说话。这已经不是模仿,甚至不是什么聪明的对仗。这是从凡间的勇武,一跃到神话的想象。我作为一个古典诗词爱好者,想破头也想不出这种句子。
这只我原以为只是在模仿平仄的“可能性之手”,它所掌握的,远不止于语言的表面规则。它在那个由亿万参数构成的、深不可测的“可能性空间”里,竟触摸到了语言、文化乃至想象力本身的灵魂。
一个全新的范式革命,正在地平线下积蓄着雷霆万钧的力量。从那一刻起,我放下了手里很多活儿,一头扎了进去。我意识到,一扇由“P”铸成的大门,就在那个瞬间,为我豁然敞开。我决定,要走进这扇门,去探寻那背后更为波澜壮阔的风景。
而这,也正是本书,特别是接下来的章节,想要与你一同探索的起点。LLM,大语言模型,这只“擒龙”的智慧之手,是如何运作的?