使用 Python 縮減臨床對話
在 Abridge,我們的使命是將背景和理解帶到每一次醫療對話中,以便人們可以隨時掌握自己的健康狀況。我們利用突破性的機器學習 (ML) 研究來幫助人們關注他們健康對話中最重要的細節。Python 為 Abridge 的 ML 生命週期中的主要方面提供支援,包括資料標註、研究和實驗以及 ML 模型部署到生產環境。

我們的移動應用程式的螢幕截圖,展示了我們的臨床概念提取模組(以粗體字顯示)和一個計劃分類器(作為 Abridge 時刻)。兩者都部分由 Python 提供支援。
機器學習
對話建模、自然語言理解、資訊提取和摘要是我們 Abridge 正在追求的一些活躍研究領域。我們的研究由一個最大的真實、去識別化且完全同意的健康對話語料庫提供支援。我們使用與臨床醫生和研究人員合作制定的指南和模板,認真地標註了資料。Google Sheets 的 Python API 使我們能夠擴充套件註釋模板的建立,將檔案適當地分配給註釋者,並有效地管理質量控制流程 —— 所有這些都不需要構建任何新的 Web 或移動應用程式。
Jupyter Notebook 是 IPython 專案的一個衍生專案,它使我們能夠在整合環境中清理資料、構建和訓練機器學習模型以及評估模型的效能。例如,我們使用 Jupyter 來構建、測試和視覺化我們最近發表的一些工作中出現的模型 —— 包括一個 藥物治療方案提取管道,該管道可以自動從醫療對話中提取藥物、劑量和頻率,以及一個自動語音識別 (ASR) 校正系統,該系統可以提高通用 ASR 系統的轉錄質量。
我們使用各種各樣的 Python 包和庫:Scikit-learn、PyTorch、AllenNLP 和 Tensorflow 用於機器學習;NLTK 和 Spacy 用於文字處理;以及 Numpy、Pandas、Matplotlib、Seaborn 用於資料探索。此外,我們使用 Django 構建儀表板來視覺化資料並定性評估我們的 ML 模型。我們所有的生產 ML 服務都是使用 Python 框架 Falcon 和 Gunicorn 構建的。使用 Python 可以輕鬆地從 ML 研究過渡到生產服務,並使我們能夠可靠地為使用者提供服務。
Python 是 Abridge 開發過程的關鍵部分。除了上述例項之外,我們還廣泛地將 Python 與多個 Google Cloud Platform (GCP) 服務結合使用,並設定其他監控和除錯工具。我們感謝 Python 社群構建了出色的工具,使我們能夠在 Abridge 提供神奇的、以患者為中心的體驗。
關於作者
Nimshi Venkat 是一名機器學習研究員,而 Sandeep Konam 是 Abridge 的聯合創始人/CTO。如果您有興趣加入我們,請檢視 https://www.abridge.com/team