Doanh nghiệp

Hippocrates AI huy động được 50 triệu USD để nâng cao năng lực cho bot chăm sóc sức khỏe

3 năm trước

Hippocrates AI huy động được nguồn vốn mới để giúp nâng cao năng lực cho những bot hỗ trợ dịch vụ chăm sóc sức khỏe dưới dạng giọng nói lẫn văn bản.

Munjal Shah hình dung ra một tương lai nơi mọi người đều có thể tiếp cận với bác sĩ dinh dưỡng, nhà tư vấn di truyền học và chuyên viên thanh toán bảo hiểm y tế chỉ bằng một nút bấm.

Tuy nhiên, không ai trong số họ là con người – tất cả họ đều là chatbot hỗ trợ dưới dạng giọng nói hoặc văn bản. Anh nói, những bot này sẽ trả lời câu hỏi của bệnh nhân cũng như cung cấp hướng dẫn với một cảnh báo chính: chúng sẽ không chẩn đoán bệnh (ít nhất là chưa).

*Munjal Shah, đồng sáng lập kiêm CEO, Hippocratic AI. Ảnh: Hippocratic AI/Forbes*

“Chúng tôi dự báo ngành y tế sẽ cần khoảng 3 triệu nhân viên y tế trong vài năm tới,” Shah nói. “Chúng tôi tin rằng nhân viên y tế chính là yếu tố chính ảnh hưởng đến chất lượng chăm sóc sức khỏe ở Hoa Kỳ trong khi đó quốc gia này đang đối mặt với tình trạng thiếu nhân viên y tế. Chúng ta cần ứng dụng công nghệ để giải quyết bài toán thiếu nhân sự này.”

Shah và bảy nhà đồng sáng lập huy động được vòng hạt giống trị giá 50 triệu USD từ General Catalyst và Andreessen Horowitz để phát triển mô hình ngôn ngữ lớn sẽ giúp tăng khả năng cho những bot cung cấp nhiều dịch vụ khác nhau liên quan đến chăm sóc sức khỏe. Họ cam kết startup Hippocrates AI ở Palo Alto đảm bảo tuân thủ quy tắc ứng xử đạo đức mà các bác sĩ thực hiện. Dựa vào những bài viết của bác sĩ Hy Lạp cổ đại Hippocrates, quy tắc đó thường được nói ngắn gọn: “không làm gì có hại.”

Nhưng các mô hình AI tổng quát không thể tuân thủ các quy tắc ứng xử đạo đức. Như những gì chatbot ChatGPT cho thấy nhiều mô hình cũng có thể đưa ra thông tin sai khi trả lời câu hỏi.

Các nhà quản lý đã hứa sẽ xem xét kỹ hơn việc sử dụng chúng trong chăm sóc sức khỏe như Ủy viên FDA Robert Califf nói rằng ông thấy “tầm quan trọng trong việc đưa ra những quy định cho các mô hình ngôn ngữ lớn trong tương lai” tại một hội nghị diễn ra hồi đầu tháng này.

Mặc dù bối cảnh pháp lý trong tương lai vẫn chưa rõ ràng, nhưng Shah cho biết Hippocrates AI đang áp dụng cách tiếp cận ba chiều để thử nghiệm mô hình ngôn ngữ lớn trong các cơ sở y tế, bao gồm việc vượt qua các kỳ thi chứng chỉ, huấn luyện dựa theo phản hồi của chuyên gia y tế, và thử nghiệm những gì công ty gọi là “cách cư xử của bác sĩ đối với bệnh nhân.”

Thay vì cung cấp cho khách hàng trong hệ thống y tế quyền truy cập vào toàn bộ mô hình, Shah cho biết Hippocrates AI đang lên kế hoạch cung cấp quyền truy cập vào các “vai trò” chăm sóc sức khỏe khác nhau, sẽ được đưa ra khi một vai trò đạt được mức độ “hiệu suất và an toàn” nhất định. Một thước đo quan trọng sẽ là người giữ vai trò đó phải vượt qua các kỳ thi cấp phép cũng như chứng chỉ.

Cách tiếp cận đó là một trong những lý do khiến Julie Yoo, đối tác chung của Andreessen Horowitz, quyết định đầu tư.

“Công ty đòi hỏi sự nghiêm ngặt ngay từ lúc ban đầu và đảm bảo tuân thủ trong quá trình xây dựng, thay vì chỉ xây dựng một nguyên mẫu rồi gửi đến cho doanh nghiệp như cách công ty phát triển phần mềm thường hay làm,” Yoo, người có công ty đầu tư vào công ty trước đây Health IQ của Shah, cho biết. Công ty đó đã sử dụng AI để kết nối người lớn tuổi với các chương trình Medicare dựa vào hồ sơ sức khỏe.

Biểu đồ so sánh tỉ lệ trả lời chính xác các câu hỏi trong những kỳ thi cấp chứng chỉ hành nghề y giữa mô hình Hippocrates AI và GPT-4. Ảnh: Hippocrates AI/ Forbes

Các bác sĩ tương lai dành nhiều năm miệt mài chuẩn bị cho một loạt kỳ thi cấp chứng chỉ hành nghề quốc gia để kiểm tra kiến thức học được từ sách vở, bài giảng cũng như kinh nghiệm thực tiễn. Vào tháng 4, Google cho biết mô hình ngôn ngữ lớn dùng trong y tế Med-PaLM 2 đạt độ chính xác 85,4% trong kỳ thi cấp chứng chỉ hành nghề ở Hoa Kỳ. Trong khi đó, Microsoft và OpenAI cho biết GPT-4, được huấn luyện dựa vào dữ liệu internet công cộng, đạt 86,65%.

Shah cho biết mỗi công ty đang thực hiện một phần của các kỳ thi (và các mô hình có thể không trả lời cùng một câu hỏi), vì vậy rất khó để so sánh, nhưng mô hình của Hippocrates AI đã đánh bại GPT-4 ở các câu hỏi trong cùng một phần dựa trên văn bản.

Shah cho biết Hippocrates AI đã thử nghiệm so sánh mô hình của công ty với GPT-4 khi làm các bài kỳ thi cấp giấy phép lẫn chứng chỉ hành nghề được sử dụng cho bác sĩ, y tá, nha sĩ, dược sĩ, chuyên gia thính học và lập trình viên y tế, cùng những chuyên gia y tế khác. Hippocrates đánh bại GPT-4 với tỉ số 105, hòa sáu và thua ba.

Nhưng điều này đặt ra câu hỏi lớn hơn về mức độ chính xác được ghi lại khi máy thực hiện bài thi cũng như những gì bài thi gợi ý có giống như sinh viên trường y làm không.

Shah thừa nhận rằng tham gia các kỳ thi là “cần thiết nhưng chưa đủ” khi triển khai các mô hình này trong hoàn cảnh thực tế. Anh từ chối nêu tên bộ dữ liệu chăm sóc sức khỏe mà Hippocrates được huấn luyện.

“Khi sinh viên trường y tham gia các kỳ thi này, chúng tôi đang đưa ra đủ loại giả định,” Curt Langlotz, giáo sư về X quang và tin học y tế, đồng thời là giám đốc của Center for Artificial Intelligence in Medicine and Imaging tại Stanford, người không có mối quan hệ gì với Hippocratic AI, cho biết. Các giả định rằng sinh viên học trường y và có kinh nghiệm lâm sàng.

“Những mô hình ngôn ngữ này là một loại trí thông minh khác. Họ đều thông minh hơn chúng ta rất nhiều nhưng cũng ngu hơn chúng ta nhiều,” ông nói. Họ được huấn luyện theo kho dữ liệu khổng lồ nhưng cũng có khả năng bị “ảo giác,” tạo ra các câu trả lời sai và mắc nhiều lỗi toán học đơn giản.

Một trong những giải pháp khác mà Hippocratic AI dự định thực hiện là sử dụng người thật để tinh chỉnh câu trả lời của mô hình, được gọi là học tăng cường với phản hồi của chuyên gia y tế.

Điều này có nghĩa là đối với một vai trò nhất định, như chuyên gia dinh dưỡng, Hippocrates AI sẽ để các chuyên gia dinh dưỡng thật đánh giá các câu trả lời và điều chỉnh cho phù hợp. Công ty cũng sẽ tiếp tục phát triển một bộ tiêu chuẩn gọi là “cách cư xử của bác sĩ đối với bệnh nhân” liên quan đến việc chấm điểm mô hình AI dựa vào các chỉ số cảm xúc như sự đồng cảm và lòng thương cảm.

“Các kỹ thuật tương tự hữu ích để cải thiện việc truyền đạt thông tin… rất hữu ích để nhận ra khi nào mô hình không biết hoặc khi nào mô hình không nên trả lời,” David Sontag, giáo sư kỹ thuật điện và khoa học máy tính tại MIT, cho biết, người không có mối quan hệ với Hippocrates AI và đang điều hành một startup về công nghệ tàng hình.

Ông đưa ra ví dụ về một tình huống trong đó câu trả lời đúng phải là yêu cầu bệnh nhân gọi 911. Huấn luyện mô hình không trả lời là một phần quan trọng của quá trình học tăng cường, ông nói.

Hippocrates AI sẽ sử dụng nhân viên y tế để huấn luyện các mô hình, và dự định hợp tác chặt chẽ với khách hàng của hệ thống chăm sóc sức khỏe trong giai đoạn phát triển, vì bệnh nhân sẽ là người dùng cuối.

Hemant Taneja, CEO của General Catalyst, cho biết công ty thu hút rất nhiều “sự quan tâm” của các hệ thống y tế khác nhau. “Để giải quyết vấn đề thiếu hụt nhân viên y tế, và bằng cách giải phóng tiềm năng con người ở quy mô lớn hơn, bạn có thể giúp cho nhiều người có thể tiếp cận được dịch vụ chăm sóc sức khỏe với mức chi phí vừa phải,” ông cho biết. “Tôi nghĩ đó là một cuộc chơi rất lớn để nâng cao tính công bằng trong công tác chăm sóc sức khỏe.”

Biên dịch: Gia Nhi

———————-

Xem thêm:

Define Ventures huy động 460 triệu USD đầu tư vào starup chăm sóc sức khỏe kỹ thuật số
Startup chăm sóc sức khỏe tâm thần ThoughtFull huy động 4 triệu USD