攜程人工智能實踐
  • 推薦0
  • 收藏0
  • 瀏覽67

攜程人工智能實踐

攜程計算機技術(上海)有限公司 (作者) 

  • 書  號:978-7-121-38440-0
  • 出版日期:2020-04-01
  • 頁  數:320
  • 開  本:16(170*240)
  • 出版狀態:上市銷售
  • 維護人:張慧敏
本書的作者來自攜程多個研發部門,從具體的應用場景入手,主要包括旅行產品的個性化推薦和搜索,旅行場景的 OCR、機器翻譯和知識圖譜,主題圖片優選、推薦理由抽取,以
及安全風險控制和如何工程化提升研發效率等,較為全面地介紹了如何對具體的業務問題進行建模,將其轉變為具體的機器學習模型,并將業務目標轉化為機器學習的目標函數。本書在此基礎上提供了一些有效的經驗,使得讀者能夠最大化利用機器學習的方式全面有效地幫助企業提升業務目標、提升人效比,乃至為網站的安全保駕護航。作者希望本書能夠幫助產品技術同人更好地理解機器學習模型的落地,給讀者帶來啟發和借鑒。
攜程集團執行副總裁張晨力薦,攜程技術團隊多年開發應用人工智能技術的結晶,選取真實技術案例,深入探索人工智能技術落地方案
攜程技術團隊
作為攜程集團的核心競爭力,攜程技術團隊由近7000位來自海內外的精英工程師組成,為攜程集團業務的運作和開拓提供全面技術支持,并以技術創新源源不斷地為產品和服務創造價值。
技術從來都不是閉門造車,攜程技術團隊會一直以開放和充滿熱情的心態,通過各種渠道和方式,和圈內小伙伴們探討、交流、碰撞,共同收獲和成長。




前 言
近年來,得益于深度學習和硬件計算能力的快速發展,人工智能技術正快速滲透到互聯網應用的方方面面,這樣的變化同樣也伴隨著攜程產品技術的迭代更新。人工智能技術不僅直接提升了攜程的訂單收入、用戶滿意度等關鍵產品指標,還在業務運營、內容生產、信息安全與風險控制等方面發揮了重要作用。
攜程作為OTA 領域的領軍企業,積累了大量的用戶出行場景數據、客服場景咨詢與溝通數據、產品相關內容數據等,這些數據在機器學習模型的訓練中發揮了巨大的作用。另外,攜程有足夠多的復雜場景,這些真實的復雜場景催生并推動了人工智能在攜程中的廣泛應用。同時,攜程的產品線豐富且分支較多,因此將人工智能服務化和中臺化成為必不可少的模塊,它會對共性需求進行收口,以通用服務/ 中臺的形式提供服務,有效降低部門之間的重復工作,節省開發成本,縮短開發周期。
與傳統的人工智能書籍不同,本書更加關注如何將具體業務場景的問題分析和模型建模轉化為具體的機器學習和深度學習問題,同時對于復雜業務場景,詳細闡述了對應的算法架構體系,也介紹了如何更好地擬合各種業務指標,如自主率、點擊率、人效比、網站的安全性等,最大限度地對業務進行賦能。作者希望通過具體的實踐案例,給讀者帶來啟發和借鑒。
作者介紹了OTA 場景在落地時的一些差異性問題,幫助用戶理解在不同應用場景中可能遇到的一些差異性問題。例如,由于旅游產品的非標屬性,用戶在決策之前非常依賴內容化信息,因此攜程在AI 內容化方面做了大量的工作和實踐,幫助用戶減少決策前的費力度;在同一酒店,不同的供應商和房型具有入住政策、軟硬件設施和價格的差異,個性化推薦的召回池不是酒店實體,而是更加細分的入住政策、服務和設施,這些是入住體驗的關鍵影響因素。
本書的內容安排如下。
第1 章和第2 章介紹了人工智能的一些基礎原理,包括數學基礎和模型構建,使讀者快速回顧和了解算法中的一些基礎內容,加深對后續章節中的技術細節的理解。
第3 章介紹了個性化推薦與搜索,如冷啟動、個性化搜索、酒店排序、瀑布流排序等方面的實踐,具體闡述如何利用算法為用戶提供更好的優質服務。
第4 章介紹了攜程在AI 服務化方面的工作,從旅游領域知識圖譜、QA 問答、機器翻譯和證件全文本識別四個方向進行詳細闡述,這些方向都能夠帶給用戶更好的服務體驗、更細致的產品細節、更快速的問題解答、國際化的暢通體驗和更便捷的操作服務。
第5 章和第6 章介紹了AI 如何有效提高工作人員在相關場景中的運營工作效率,從內容產品化、房態預測、用戶模擬評分、郵件自動化、實時智能異常檢測等多個方面進行了具體介紹,有效地發現了業務趨勢和問題,并在一定條件下進行了自動處理。
第7 章和第8 章介紹了AI 在信息安全和風險控制方面的一些具體應用,詳細闡述了對應的難點、目標和解決方案。
第9 ~ 11 章介紹了在AI 中臺化方面的實踐——AI 挖掘中臺、AI 運營中臺和通用數據服務,說明了在中臺化建設中如何進行業務架構和系統架構規劃。
本書面向的讀者主要是人工智能領域的從業人員,包括產品和技術同人,同時也歡迎從事其他崗位和行業的讀者通過閱讀本書,對人工智能的原理和應用有一定的了解,一起探索和拓展人工智能的應用落地。對于想要入門的算法同人,建議詳細閱讀數學基礎和模型構建章節,以便能夠更好地結合理論和實踐。沒有相關數學知識背景或僅僅對具體應用場景感興趣的同人,可以跳過數學基礎和模型構建的內容。
感謝參與本書寫作的來自攜程的同人,他們將工作中的寶貴經驗進行提煉和總結,并形成知識體系分享給讀者。感謝出版社的工作人員,在本書的出版過程中給予的幫助和支持。
《攜程人工智能實踐》編委會

目錄

目 錄
第1 章 數學基礎 001
1.1 引言 001
1.2 線性代數 001
1.2.1 概述 001
1.2.2 向量與矩陣 002
1.2.3 矩陣的運算 003
1.2.4 幾種特殊的矩陣 005
1.2.5 線性方程組與矩陣的逆 007
1.2.6 特征值和特征向量 010
1.2.7 張量的定義和運算 011
1.3 概率基礎 013
1.3.1 頻率與概率 013
1.3.2 熵 016
1.3.3 常見的概率分布 017
1.4 優化理論 020
1.4.1 優化理論簡介 020
1.4.2 無約束的優化問題 022
1.4.3 無約束的優化方法 024
1.4.4 風險函數的優化方法 026
1.4.5 帶約束的優化方法 028
1.5 本章小結 031
參考文獻 031

第2 章 模型構建 032
2.1 引言 032
2.2 建模流程 032
2.2.1 目標定義 032
2.2.2 損失函數 035
2.2.3 求解優化 037
2.2.4 結果評估 037
2.2.5 模型選擇 040
2.3 常見模型 042
2.3.1 模型的分類方法 042
2.3.2 回歸模型 043
2.3.3 邏輯回歸模型 047
2.4 集成學習 049
2.4.1 集成學習概述 049
2.4.2 Bagging 051
2.4.3 Boosting 052
2.5 本章小結 055
參考文獻 057

第3 章 個性化推薦與搜索 058
3.1 個性化推薦概述 058
3.2 跨領域推薦改善用戶冷啟動問題 059
3.2.1 背景描述 059
3.2.2 基礎定義 060
3.2.3 建模思路 061
3.2.4 模型結構 062
3.2.5 實驗結果 065
3.3 Bandit 算法在攜程場景中的應用實踐 066
3.3.1 Context-free Bandit 算法 067
3.3.2 Contextual Bandit 算法 069
3.3.3 場景應用 070
3.4 旅游度假產品的搜索個性化排序 078
3.4.1 度假搜索排序框架 079
3.4.2 度假搜索排序算法 080
3.4.3 模型演進及其他 085
3.4.4 小結 086
3.5 深度學習在酒店房型推薦中的應用實踐 087
3.5.1 酒店房型推薦業務的背景 087
3.5.2 業務問題轉化為算法問題 087
3.5.3 算法流程 088
3.5.4 小結 089
3.6 強化學習在酒店排序中的應用實踐 089
3.6.1 業務背景 089
3.6.2 傳統排序學習的局限性 090
3.6.3 強化學習的基本思路 091
3.6.4 算法流程 091
3.6.5 小結 093
3.7 瀑布流排序算法實踐 094
3.7.1 場景簡介 094
3.7.2 優化目標 094
3.7.3 特征工程 095
3.7.4 模型 097
3.7.5 位置偏差 098
3.7.6 評價指標 099
3.7.7 場景實踐 101
3.8 本章小結 101

第4 章 AI 服務化 102
4.1 AI 服務化的背景與難點 102
4.2 旅游領域知識圖譜 102
4.2.1 旅游領域知識圖譜的特點 103
4.2.2 旅游領域知識圖譜的構建 104
4.2.3 旅游領域知識圖譜的應用 112
4.3 QA 問答中的文本匹配與排序 117
4.3.1 基于深度學習的語義匹配模型 118
4.3.2 基于交互的語義匹配模型 122
4.3.3 遷移學習在語義匹配網絡中的應用 125
4.3.4 對語義匹配模型的一些思考 127
4.4 攜程國際化中的機器翻譯 130
4.4.1 模型架構 130
4.4.2 建模技巧 135
4.4.3 翻譯質量評估 138
4.5 證件全文本識別 141
4.5.1 文本識別簡介與發展歷程 141
4.5.2 文本識別步驟 142
4.5.3 文本檢測 142
4.5.4 文本識別 145
4.5.5 文本識別在證件識別中的應用實踐 145
4.6 本章小結 147
參考文獻 147

第5 章 AI 助力產品運營 150
5.1 旅游場景中的主題圖片自動優選 151
5.1.1 業務場景 151
5.1.2 圖像識別 151
5.1.3 圖像去重 154
5.1.4 圖像優美度識別 155
5.1.5 小結 158
5.2 知識推理在攜程業務中的應用 158
5.2.1 標簽系統的業務背景和業務痛點 159
5.2.2 標簽規則配置平臺的設計與實現 160
5.2.3 小結 164
5.3 基于專名的內容產品化 165
5.3.1 內容產品化的業務背景 165
5.3.2 命名實體識別 165
5.3.3 實體鏈接 168
5.3.4 小結 174
5.4 主題推薦理由抽取 174
5.4.1 主題推薦理由抽取的業務背景 174
5.4.2 智能內容抽取 175
5.4.3 自動內容生成 186
5.4.4 小結 193
5.5 本章小結 194
參考文獻 194

第6 章 AI 運營 199
6.1 問題的背景與難點 199
6.2 機器學習在海外酒店房態預測中的運用 201
6.2.1 業務背景 201
6.2.2 海外酒店房態預測的難點 201
6.2.3 海外酒店房態預測難點的解決方案 202
6.2.4 海外酒店房態預測的應用場景 208
6.3 IM+ 用戶模擬評分 209
6.3.1 業務背景 209
6.3.2 基于深度學習的模擬評分 210
6.3.3 技術方案流程 214
6.4 海外郵件自動化 215
6.4.1 業務背景 215
6.4.2 自然語言處理在郵件自動化中的應用 216
6.5 實時智能異常檢測平臺的算法及工程實現 221
6.5.1 應用場景 221
6.5.2 大而全的監控衍生出的問題 222
6.5.3 統計模型的困擾 222
6.5.4 算法選擇和設計目標 223
6.5.5 算法的描述和檢驗 225
6.5.6 實時性工程 231
6.6 本章小結 233

第7 章 信息安全 234
7.1 問題的背景與難點 235
7.2 機器學習在Web 攻擊檢測中的實踐 235
7.2.1 攜程Web-IDS 攻擊檢測系統架構介紹 235
7.2.2 定義目標問題 238
7.2.3 收集數據和實現特征工程 238
7.2.4 模型效果評估 240
7.2.5 線上應用和持續優化 241
7.3 機器學習在滑塊驗證碼防御中的實踐 242
7.3.1 滑塊驗證碼人機識別 243
7.3.2 滑塊驗證碼軌跡相似度識別 247
7.4 本章小結 253
參考文獻 253

第8 章 風險控制 254
8.1 自動化迭代反欺詐模型體系 254
8.1.1 風控變量體系 256
8.1.2 自動化迭代模型框架 256
8.1.3 RNN 表征學習 259
8.1.4 自動化與傳統方法的效果對比 261
8.2 “程信分”模型體系 263
8.2.1 “程信分”模型 263
8.2.2 “閃住”催收模型 266
8.3 主動學習在業務風控場景中的應用 268
8.3.1 酒店反刷單主動學習模型 268
8.3.2 機票防虛占主動學習模型 271
8.4 本章小結 273
參考文獻 273

第9 章 AI 挖掘中臺 274
9.1 AI 挖掘中臺的背景 274
9.2 AI 挖掘中臺的框架和功能 275
9.2.1 AI 挖掘中臺的構成 275
9.2.2 AI 挖掘操作步驟 276
9.2.3 AI 挖掘中臺的組件及工作流程 279
9.2.4 AI 挖掘中臺應用成效 281
9.3 大數據和人工智能的賦能 281
9.4 本章小結 282

第10 章 AI 運營中臺 283
10.1 AI 運營中臺的背景 283
10.2 AI 運營中臺的框架和功能 284
10.2.1 框架 284
10.2.2 流程 288
10.2.3 模塊 289
10.3 AI 運營中臺的高效運營 290
10.3.1 AI 賦能方式 290
10.3.2 企業應用實例 291
10.4 本章小結 292

第11 章 通用數據服務 294
11.1 通用數據服務的背景 294
11.2 通用數據服務平臺的架構和功能 295
11.2.1 通用數據服務平臺的架構 295
11.2.2 通用數據服務平臺的功能模塊 295
11.3 通用數據服務的監控 299
11.3.1 存儲監控 300
11.3.2 查詢監控 300
11.3.3 寫入監控 301
11.4 本章小結 302

讀者評論

十一选五开奖结果云