「這本小說憑什麼大賣?」
從《格雷的五十道陰影》到《控制》,從丹布朗到法蘭岑
暢銷書都有模式可循,還能精準預測!
用新科技說故事的先驅!──《故事如何改變你的大腦》作者 哥德夏
為出版界帶來重大革命的一本書!──《衛報》
暢銷書的背後,總存在某種引人上鉤的共通魅力。
我們恨不得翻遍上萬本小說找出答案,但人類的能力終究有限。
本書兩位作者來自史丹佛大學的文學實驗室,
他們歷時五年,運用文字探勘技術,
訓練電腦「閱讀」兩萬部小說,
全面破解《紐約時報》暢銷書在題材、情節、角色和風格上的共同模式,
告訴你人類如何閱讀,以及小說引人入勝的終極關鍵。
原來──
◎《格雷的五十道陰影》和《達文西密碼》竟然擁有完全相同的說故事節奏!
◎ 動詞運用洩露出《龍紋身的女孩》和《列車上的女孩》主角擁有共同特質!
◎ 暢銷作家都有兩至三個拿手題材,而且占據了每部作品三分之一的篇幅!
◎ 標點符號具有預測能力,暢銷書出現問號的比例特別高!
◎ 電腦判定的暢銷作家以女性居多,而史蒂芬.金被認定為女性!
不僅如此,電腦還可以進一步運用研究結果預測暢銷書,
只憑書稿,不論作者名氣或行銷運算,
預測準確度就已超過八成──
◎麥可.康納利的《林肯律師》暢銷書指數99.2%
◎丹.布朗的《地獄》暢銷書指數95.7%
◎安迪.威爾的《火星任務》暢銷書指數 93.4%
◎希維雅.黛的《謎情柯洛斯》暢銷書指數 91.2%
史無前例,《暢銷書密碼》是第一本「電腦觀點」的小說分析,
運用新科技帶我們重新理解好故事如何打動人心。
無論你熱愛小說、寫作或資料科學,
都可以從本書得到¬前所未有的樂趣和啟發。
作者簡介:
茱蒂.亞契(Jodie Archer)
曾任英國企鵝出版社資深編輯,因為厭倦暢銷書難以預測帶來的徒勞而離開職場,前往史丹佛大學攻讀英國文學博士。自2010年開始和馬修.賈克斯共組研究團隊,逐漸改變她對於預測暢銷書的態度。畢業後受邀至蘋果進行文學研究,從事過的每一個工作都和書有關,現為全職作家。
馬修.賈克斯(Matthew L. Jockers)
史丹佛大學「文學實驗室」(Literary Lab)共同創辦人,致力運用電腦科技來研究文學。研究領域包括文字探勘、數位人文學等,認為暢銷書可以經由科技準確預測。著有《宏觀分析:數位方法與文學史》、《用R語言做文字探勘》。現任教於內布拉斯加大學林肯分校。
譯者簡介:
葉妍伶
畢業自英國愛丁堡大學翻譯研究所、國立師範大學翻譯研究所口譯組。譯有暢銷書《遇見你之前》(電影《我就要你好好的》原著小說)、《你轉身之後》,以及諾拉.羅伯特和史蒂芬.金等多位作家的作品。Email: reneeinterprets@gmail.com
各界推薦
名人推薦:
顏擇雅 出版人
陳昇瑋 中央研究院資訊科學所研究員
媒體推薦:
為出版界帶來重大革命的一本書!
──《衛報》
一個故事能吸引數百萬人閱讀,那是魔法。魔法能被描述嗎?這本書做到了!
──《紐約時報》暢銷作家 希維雅.黛
實在出色!亞契和賈克斯用前所未見的視角洞悉暢銷小說的DNA,並轉換成引人入勝的文字,告訴我們人類究竟如何閱讀。
──《大數據》作者 麥爾.荀伯格
《暢銷書密碼》是用新科技說故事的先驅。
兩位作者創造了一個閱讀機器人,教導讀者、作家、出版人所有關於暢銷小說的運作。
──《故事如何改變你的大腦》作者 哥德夏
想寫小說的人都恨不得把這本書翻爛,徹底研究一番。
──《公共讀書雜誌》
名人推薦:顏擇雅 出版人
陳昇瑋 中央研究院資訊科學所研究員媒體推薦:為出版界帶來重大革命的一本書!
──《衛報》
一個故事能吸引數百萬人閱讀,那是魔法。魔法能被描述嗎?這本書做到了!
──《紐約時報》暢銷作家 希維雅.黛
實在出色!亞契和賈克斯用前所未見的視角洞悉暢銷小說的DNA,並轉換成引人入勝的文字,告訴我們人類究竟如何閱讀。
──《大數據》作者 麥爾.荀伯格
《暢銷書密碼》是用新科技說故事的先驅。
兩位作者創造了一個閱讀機器人,教導讀者、作家、出版人所有關於暢銷小說的運作。
──《故事如何改變你...
章節試閱
一般認為,小說家必須要擅長幾項技巧才能贏得讀者的心,光是文法正確還不夠,情節得要緊湊、角色得要動人。但作家要擁有廣大粉絲還要具備更多能力:洞察人性、創造高潮迭起,就連標點符號也要用得精妙。這都是好作家的基本條件,只要投入時間和努力,幾乎所有優秀的作家都會有讀者支持。但要大賣到讓幾十萬、上百萬人同時買單,除非有歐普拉在背後推波助瀾,否則這本書必定是具備了某種極為罕見的魔力。很多人認為《龍紋身的女孩》、《格雷的五十道陰影》、《姊妹》、《控制》和《達文西密碼》能大賣都是因為幸運,但這樣的運氣就像樂透般無法捉摸。
文學雜誌《書人》分別於1891年及1895年在倫敦與紐約推出「每月書籍銷售榜」,這些排行榜以城市為統計範圍,每個月列出銷量最好的六本書。這些榜單為出版業帶來了兩項全新的意義:首先,這份榜單完全只看銷量,不看其他,而且可以拿給讀者做為推薦書單。讀者在買書的時候不必再只侷限於少數一兩位書評或出版商的意見,而是可以透過暢銷書單看到其他讀者的喜好。從過去到現在,讀者的選擇都是暢銷書排行榜的唯一指標。
這樣看來,「暢銷書」這個詞理當和書籍的品質或種類無關,它也不是「類型小說」或「大眾小說」的同義詞。然而,文壇裡有些人就是瞧不起暢銷書,他們覺得大眾品味怎麼可能會好,但其實數字本身是客觀的,呈現出來的也都是事實。暢銷書其實包山包海,有普立茲獎得獎作品,有美國經典文學,也有大眾市場裡知名作家的小說。暢銷榜上有諾貝爾文學獎得主童妮.摩里森、女權作家瑪格麗特.愛特伍,也有懸疑推理小說家麥可.康納利和言情小說作家黛比.瑪康珀。這就是為什麼暢銷書單富含文化深意、值得我們探究的原因。
很顯然,對作家來說,寫出一本暢銷書很有價值;對經紀人或編輯來說,能找到一本暢銷書也很有價值。對書商也不例外──有些書商之所以能一直經營下去,就是靠那幾本暢銷書在賺錢啊。
當然,我們這裡講的都是金錢價值。想像一下,你曾經說給朋友聽的故事即將出版成書,而你可以拿到幾百萬甚至上千萬美元的預付版稅,那會是怎麼樣的感覺?能做到這樣的作家並不多,但不是沒有。窮作家拿著紙筆創作固然很浪漫,但若你寫的故事可以大賣,陪伴世界各國不同語言的讀者通勤、入浴或入睡,豈不是更加美好?
年復一年,書市裡最暢銷的作家都能享有榮華富貴般的戲劇人生,他們住豪宅、開名車,頭頂宛若戴著文學界的鑽石王冠。如果作品能上榜並且在榜上停留一陣子,隨之而來的就是眾人的尊重、景仰、批評和攻擊。可能會有人邀請你當評審或寫評論,或許小說還能翻拍成電影。總之你的書會不斷被人討論。
如果成功不必靠運氣而是有模式可循,那豈不是很棒?
本書最狂發言:《紐約時報》暢銷書可以預測,想登榜不必碰運氣。
暢銷書之所以能預測並不是像大家想的那樣,靠作家名氣、靠行銷預算、靠砸大錢做宣傳。事實上,成功背後另有原因。別再擔心封面設計了,也別再派小編上臉書和推特發文,找名人推薦也免了吧。這些事情都不會影響到你是不是「下一個諾拉.羅伯特」或「下一個大衛.鮑爾達奇」。暢銷書之所以暢銷和這些因素都沒有關係。新書有沒有登上主流媒體,檔期選在春夏秋冬哪一季出版也無所謂。這些都是裝飾雞尾酒杯的小紙傘,都是無關緊要的東西,只會轉移焦點。要預測一本小說能不能大賣,最重要的依據還是書稿,白紙黑字,未經包裝。
但光有書稿不夠,還需要一套電腦模型,它能閱讀、辨識,並從成千上萬本小說中歸納出數千種寫作特徵,這樣才能準確預測哪一本書能在市場中勝出。我們在本書裡會解釋我們如何開發出這套電腦模型,以及我們為什麼想做這件事;也會說明我們如何運用電腦模型來預測暢銷書,並達到80%~90%的準確度。
過去三十年來,凡是能登上《紐約時報》精裝書暢銷榜冠軍,或是在排行榜蟬聯數週以上的作品,通通都可以預測,而且誤差率只有10%~20%。不僅如此,電腦模型還可以判斷一份全新書稿「可能會上榜」或「可能不會上榜」,並估計它的暢銷指數,這個分數代表一本書的上榜機率。光是計算暢銷指數就夠迷人了,我們還將在書裡公開暢銷指數的原理,也會向大家解釋為什麼你床邊那本書讓你一翻開就停不下來。
大家來看這些數字。根據電腦模型的預測,丹.布朗的最新力作《地獄》暢銷指數有95.7%;麥可.康納利的《林肯律師》(即電影《下流正義》的原著小說)更高達99.2%。兩本書都是《紐約時報》精裝書暢銷榜冠軍,這可是出版界的兵家必爭之地,能登冠就有無上榮耀。
上述兩位作家都是文壇老將,但電腦模型並不曉得他們名氣響亮,無論作者有名沒名都不會影響電腦判斷。舉例來說,凱特.賈克柏的《星期五編織社》暢銷指數有98.9%;潔西卡.諾的處女作《最幸運的女孩》獨樹一格,電腦光憑書稿就給了99.9%的超高分。兩位作家都在排行榜上待了好幾個禮拜才下來。
不僅如此,電腦還能預測不同類型的小說。在麥特.戴蒙想演出電影之前,《火星任務》的暢銷指數就已經有93.4%;米奇.艾爾邦的心靈成長小說《來自天堂的第一通電話》有99.2%;查德.哈巴赫的處女作《防守的藝術》有93.3%;希維雅.黛的情慾羅曼史小說《謎情柯洛斯Ⅰ:坦誠》則有91.2%。
這些數字的存在,以及精準到小數點的程度,的確讓某些人很興奮,但也激怒了某些人,更讓許多人心生懷疑。其實他們會有這樣的反應也很合理,因為電腦的預測結果很暴力、超乎尋常。對某些業界資深前輩來說,這種預測簡直荒唐。但這套預測方法可能會顛覆整個出版業,從根本改變你對暢銷書為何暢銷的想法。
我們應該先講清楚,我們這裡提到的所有小說,都不是因為先得到了超高的暢銷指數才被出版。事實上,我們從來沒有把這些數字透漏給任何出版社。儘管有些厲害的編輯在出版業號稱是金手指,但各位別忘了,暢銷書出現的機率還不到0.5%,要押對寶其實是一場豪賭。
還有,年復一年,排行榜上總是會有幾個反覆出現的老面孔。史蒂芬.金六十八歲,詹姆斯.派特森六十八歲,丹妮.斯蒂爾也六十八歲。雖然這些老將每次出新書都還是令讀者期待不已,但這其實透露著出版界還沒有找到新一代的暢銷作家,能像老一輩一樣持續三四十年不斷寫出暢銷作品。儘管每年都有數千部小說被退稿或出版,但2014年並沒有出現任何超級暢銷書(榜上的《龍紋身》、《格雷》和《控制》都是在前幾年就已經熱賣的小說),就連2012年的普立茲小說獎也從缺。怎麼會這樣?
這個嘛,大家都知道暢銷書是異類,可遇不可求。所以出版社一旦發掘了一位暢銷作家,又何必再去投資其他新作家?何必在二十九歲的新銳作家身上砸下數百萬美元?錢都花在史蒂芬.金身上就好了嘛。畢竟,年輕新秀會不會成為明日之星根本無從判斷。
出版人其實和賭徒沒有兩樣。在選書會議上,大家經常熱切爭論著是否要在某位新作家身上「賭一把」。而出版社在競標版權的時候,難免會忍不住「梭了」,把一整季的預算全部押在一本書上。這個過程很刺激,大家也不是全憑運氣,多少依恃著經驗和見識,但這終究是一場賭局。
J. K. 羅琳在找到出版社簽約之前,《哈利波特》曾經慘遭十二家出版社退稿,還有人佛心勸她「別辭掉工作」。誰知道,《哈利波特》品牌目前的估值有150億美元。約翰.葛里遜曾經被至少十六家出版社退稿,結果他後來寫出了十多本年度最暢銷小說。詹姆斯.派特森當年想出版他的作品,卻屢遭拒絕。而在2010年,他的三本小說合計售出350萬冊。凱瑟琳.史托基特一共被六十位經紀人回絕,才終於找到有人願意代理《姊妹》,結果這本小說一上市就在《紐約時報》暢銷書榜蟬聯了一百週。不必懷疑,現在一定還有很多境遇類似的作家,他們的作品被扔在紐約或倫敦出版社辦公室裡,埋沒在其他未出版的書稿之中。
任何一個能和讀者或作家圈沾上邊的人,總會有某個朋友的朋友,他也許會花上好幾個月,每天凌晨四點起床,利用上班前的時間寫小說;也許會在看完一部殺手小說後靈感乍現;又或許他信手拈來便珠圓玉潤;或許他已經把稿子寄給紐約市各大出版社,既期待又興奮,結果收到的卻是制式退稿信。
這些朋友的朋友都還沒碰過真正的毒舌。有位編輯在讀完《冷戰諜魂》的手稿之後,就說約翰.勒卡雷想當作家絕對沒前途。威廉.高汀的《蒼蠅王》被退稿了二十一次。經典作品《在路上》也難逃批評,曾有一位經紀人寫信給傑克.凱魯亞克說:「我一點都不想看這本書。」娥蘇拉.勒瑰恩被退稿的理由是「根本看不下去」,結果這部根本看不下去的小說連續獲得兩項大獎。就連喬治.歐威爾的中篇小說《動物農莊》也被退稿,而且拒絕出版這本書的正是後來拿到諾貝爾文學獎的詩人艾略特。《動物農莊》雖被奉為政治諷刺文學經典鉅作,但在當年大文豪的眼中卻是「毫無說服力」。
要不要出版一本書是個大學問。而這一行就是在說故事,想要準確預測誰能大紅大紫,就得推敲數十萬不同讀者的情感與自我。這可不容易,而決策背後的理由聽起來往往都很有道理。舉例來說,拒絕《龍紋身的女孩》的美國編輯(我們真的採訪了其中幾位)認為美國讀者才不會對瑞典政治感興趣。又以女主角的設定來說,莎蘭德有點陰晴不定而且好鬥善戰。這本書還有許多殘暴情節,不但有強暴和肛交,莎蘭德還拿著紋身針頭一心尋仇。編輯相信,主流市場的讀者不會喜歡這些東西──他們會有這種反應也是情有可原。
難怪有些編輯在掏心掏肺的時刻會坦承,要預測哪本書會大賣,只能舔舔手指舉起來測風向,要不然就是去膜拜收入最高的那些出版人藏在辦公桌底下的神祕水晶球。除非作者已經享譽盛名,否則選書根本就和賭骰子一樣。
有時候一本書的外在條件可以幫助判斷,舉例來說,某本書的作家已經是好萊塢女神,而書的內容就是在講她的性生活。這種書再怎麼想都十拿九穩,但我們還是看過出版社在付出巨額預付版稅之後,把印出來的書都拿去打成紙漿。我們只能說,世事無常啊。
文學教授約翰.蘇瑟蘭(John Sutherland)有兩項研究都以暢銷書為題,其中一項的結論是:「暢銷書的定義就是銷量最好的書,沒別的意思。」他又鄭重地補充道:「要從暢銷書裡找出明顯的模式、潮流或雷同,根本沒有意義,充其量只能說是自討苦吃。」這個評斷既誠懇又公允,應該是他說了就算。但是當電腦開始有能力讀書之後,一切都大為不同了;電腦對暢銷書的預測,精準到讓人瞠目結舌。
你可能很好奇,優秀稱職的編輯已經很會選書了,為什麼還要開發一套電腦模型來做編輯的工作呢?或許有了這套模型,羅琳的作品就能早點問世;或許葛里遜就可以靠《殺戮時刻》拿到更高額的預付版稅。但這又如何,終究,這些作家還是出名了。編輯原本對《姊妹》沒什麼信心,電腦模型也同樣預測不出來。所以這麼做到底有什麼好處?
這個嘛,我們想預測哪本書會大賣,並不只是為了錢。當年如果有這套模型,羅琳、法蘭岑(98.5%)和黎安.莫瑞亞蒂(99.6%)就能早點出版他們的作品,這個想法令人著迷。我們認為,各種關於人類與機器合作的討論確實很重要,尤其是在創作的領域裡。出版業現今飽受威脅,若我們有機會發掘出更多受讀者喜愛的小說,或許能讓產業繼續欣欣向榮。說得更務實一點,我們想要發掘新作家,想要鼓勵出版社把花在老作家身上的錢拿來栽培年輕作家,因為總有一天後浪會推前浪。我們希望所有作家,不分寫作資歷,都能得到更多資訊和幫助。有些有潛力的新秀想出版卻沒有門路,我們希望能將他們的作品介紹給讀者。
正因為電腦模型不在乎你有沒有出過書、有沒有拿過藝術創作碩士學位,也不管你是西班牙裔或亞裔、是男是女、長得正不正、年輕或老邁,所以,我們的工作其實是在讓更多人能接觸到寫作這一行。或許有一天,你那位朋友的朋友完成了創作,電腦判定暢銷機率高達八成,讓他因此獲得一筆預付版稅,可以辭掉工作專心創作,再也不必每天凌晨四點起床敲鍵盤了。
暢銷書通常不太容易受到重視,因為很多人認為那只不過是消遣,算不上是文學藝術,應該也不需要什麼寫作功力。但如果我們忽略暢銷書,當代文化與閱讀歷史就會缺一大塊。暢銷作家不但可以創造數百萬美元的產值,更可貴的是,他們的作品讓我們願意「閱讀」。他們釋放我們的想像與情緒,鼓勵我們去討論、去思考、去體會;他們讓我們能幻想另一個情景、偷窺主角的心境、逃逸到不同時空。我們期待他們形塑文化的方向、帶我們瞭解這個世界,也期望能從他們身上領略品味和思想,讓我們練習表達自己的想法。
一般認為,小說家必須要擅長幾項技巧才能贏得讀者的心,光是文法正確還不夠,情節得要緊湊、角色得要動人。但作家要擁有廣大粉絲還要具備更多能力:洞察人性、創造高潮迭起,就連標點符號也要用得精妙。這都是好作家的基本條件,只要投入時間和努力,幾乎所有優秀的作家都會有讀者支持。但要大賣到讓幾十萬、上百萬人同時買單,除非有歐普拉在背後推波助瀾,否則這本書必定是具備了某種極為罕見的魔力。很多人認為《龍紋身的女孩》、《格雷的五十道陰影》、《姊妹》、《控制》和《達文西密碼》能大賣都是因為幸運,但這樣的運氣就像樂透般...
目錄
第1章 暢銷書量表:文字探勘將顛覆出版?
第2章 小說題材組合:再忙也要與你共進晚餐?
第3章 小說情緒轉折:你知道你拉錯線條了嗎?
第4章 小說文字運用:為什麼連一顆逗點都很重要?
第5章 小說人物塑造:當黑女孩憑什麼當紅?
第6章 綜合分析:誰寫出了滿分小說?
結語 人類作者會被電腦取代嗎?
後記 電腦預測暢銷書的基本原理
第1章 暢銷書量表:文字探勘將顛覆出版?
第2章 小說題材組合:再忙也要與你共進晚餐?
第3章 小說情緒轉折:你知道你拉錯線條了嗎?
第4章 小說文字運用:為什麼連一顆逗點都很重要?
第5章 小說人物塑造:當黑女孩憑什麼當紅?
第6章 綜合分析:誰寫出了滿分小說?
結語 人類作者會被電腦取代嗎?
後記 電腦預測暢銷書的基本原理