後 ChatGPT 時代的新職業 — AI 工程師

2023年12月30日

ChatGPT 教學專書
不僅教你 ChatGPT 指令,更帶你實作出創新應用!前往了解

在開源界小有名氣的工程師 swyx 先前發了一篇《The Rise of the AI Engineer》分析在後 ChatGPT 時代出現的新職種 — AI 工程師 (AI Engineer)。

在 ChatGPT 剛出來時,許多企業開始招募提示詞工程師 (Prompt Engineer),但是在過去半年的演進,企業開始發現只有提示詞完全不夠,想要把大型語言模型成功整合進產品,還需要其他不同的工具與技能,例如要搭配嵌入 (Embeddings) 與向量資料庫,同時要會用 OpenAI 自己都推的 LangChain。

要懂提示詞,又要懂這些不同的工具與技能,這顯然不僅是提示詞工程師,但這也已經超出傳統對全端工程師的定義,同時在做的事也不是機器學習工程師,或研究科學家在做的事。因為過去的職稱都不全然吻合這個新興類別,swyx 用 AI 工程師 (AI Engineer) 一詞來定義這個新職種。

他的定義分界是劃在 API 這一層。API 層的左端是 AI 研究科學家,他們精進模型並開發 API (例如 OpenAI 開發 ChatGPT API 或 Anthropic 開發 Claude API)。API 層右邊則是有 AI 工程師以及傳統的全端工程師。在 swxy 的文中,很清楚地區分從底層到應用層有哪些不同的角色。根據他的觀察,現在 AI 工程師這類別,在企業中多半會由偏向應用端的工程師負責,因為仍是消費開發好的 API。

而社群中的前輩 vgod,先前也分享類似的觀察。他說「我覺得未來 AI/ML 工程師需求會往兩極化發展。能開發新的 ML 演算法、大型基礎模型、還有相關基礎設施的人需求會增加,但只有大型科技公司或是專門做基礎模型的公司才會需要這些人。模型越大需要做的工程就越多,像 GPT-3 這種規模的模型早已不是一台電腦一個工程師花幾個小時就能訓練出來的。背後需要龐大的基礎設施,數百顆 GPU 花上數個月分散式訓練一個超大模型。訓練一次的費用是以百萬美金起跳。MLOps 在這種公司會變成量身打造的大型系統,最佳化每一個環節,增進開發效率,盡可能降低開發成本。但對於一般的中小型公司而言,想要開發 AI 應用,從頭訓練自己的大型模型並沒有意義,不但花錢花時間而且得到的模型也不會比較好,不如專注於整理好自己的私有資料集後再去微調現有的模型。

另一方面,做應用的『AI 工程師』會增加,但他們的工作跟傳統 ML 開發流程不會有太大關係。像 GPT-3 和 Stable Diffusion 這類的模型會變成新世界的『基礎模型』(foundation model),大量公司可以用『自然語言』跟模型溝通,在上面搭建各種應用。只要善用我另一篇文章說的『語境學習』能力,很多任務都可以靠給出特定的『提示』(prompt) 來解決。」

先前 ExplainThis 就有分享,蘋果等大廠,在一般軟體工程師的職缺中,已經有加入 LangChain 的技能要求。相信這個趨勢只會越來越增長,就像過去全端工程師要會前端與後端,可預見未來的全端工程師,會需要前端 + 後端 + 整合 AI 的能力。

🧵 如果你想收到最即時的內容更新,可以在 FacebookInstagram 上追蹤我們