工作職責(zé):
本崗位核心負(fù)責(zé)對接 Gemini、Vidu 等主流 AI 模型服務(wù)的 API 接口,完成模型服務(wù)的集成、封裝與工程化落地,同時參與 AI 模型服務(wù)架構(gòu)設(shè)計與優(yōu)化,保障模型服務(wù)的高可用、高性能與可擴(kuò)展性。
AI 模型 API 對接與封裝:負(fù)責(zé) GPT、Claude、Gemini、Vidu等各類 AI 模型服務(wù)的 API 對接,完成接口適配、數(shù)據(jù)格式轉(zhuǎn)換與統(tǒng)一封裝,提供標(biāo)準(zhǔn)化的模型調(diào)用接口給業(yè)務(wù)層。
模型服務(wù)架構(gòu)設(shè)計:結(jié)合業(yè)務(wù)場景,參與 AI 模型服務(wù)的整體架構(gòu)設(shè)計,包括接口層、緩存層、熔斷降級層等模塊的設(shè)計,具備微服務(wù) / 分布式架構(gòu)思維,保障服務(wù)的高并發(fā)與高可用。
工程化落地與優(yōu)化:負(fù)責(zé)模型服務(wù)的工程化實(shí)現(xiàn),包括服務(wù)部署、性能調(diào)優(yōu)、資源監(jiān)控與故障排查;優(yōu)化 API 調(diào)用的延遲、成功率,解決模型調(diào)用中的網(wǎng)絡(luò)、限流、超時等問題。
容錯與穩(wěn)定性保障:設(shè)計并實(shí)現(xiàn)模型服務(wù)的容錯機(jī)制(如重試、熔斷、降級、負(fù)載均衡),制定異常處理策略,保障模型服務(wù)在高負(fù)載或第三方 API 故障時的穩(wěn)定性。
文檔與協(xié)作:編寫 API 對接文檔、服務(wù)設(shè)計文檔與運(yùn)維文檔;與算法團(tuán)隊、業(yè)務(wù)產(chǎn)品團(tuán)隊協(xié)作,理解模型能力與業(yè)務(wù)需求,推動 AI 模型服務(wù)的落地與迭代。
技術(shù)調(diào)研與迭代:跟蹤主流 AI 模型服務(wù)的新特性、新接口,調(diào)研行業(yè)內(nèi)模型服務(wù)集成的*佳實(shí)踐,持續(xù)優(yōu)化現(xiàn)有模型服務(wù)架構(gòu)與集成方案。
任職資格:
本科及以上學(xué)歷,計算機(jī)、軟件工程、人工智能等相關(guān)專業(yè);3 年及以上 Python 開發(fā)經(jīng)驗(yàn),有 AI 模型服務(wù) API 對接 / 集成經(jīng)驗(yàn)者優(yōu)先。
精通 Python 編程語言,熟練掌握 requests/aiohttp 等 HTTP 請求庫,熟悉 JSON/Protobuf 等數(shù)據(jù)序列化格式;掌握 FastAPI/Flask/Django 等 Web 框架,具備接口開發(fā)與維護(hù)能力。
熟悉 Docker 容器化部署、Kubernetes 容器編排,具備服務(wù)部署與運(yùn)維經(jīng)驗(yàn);了解 CI/CD 流程(如 GitLab CI、GitHub Actions),能搭建自動化構(gòu)建與部署流水線。
有對接 Gemini、Vidu、OpenAI、Claude 等主流 AI 模型 API 的實(shí)際經(jīng)驗(yàn),熟悉第三方 API 的調(diào)用規(guī)范、限流策略與鑒權(quán)方式的優(yōu)先。
具備較強(qiáng)的問題排查能力,能定位 API 調(diào)用中的網(wǎng)絡(luò)問題、性能瓶頸與異常故障的優(yōu)先。