Công nghệ cho phép bạn phiên âm các cuộc họp công việc của bạn có thể giúp mọi người bị tê liệt nói lại.
Các nhà nghiên cứu tại UC Berkeley và UC San Francisco đã sử dụng AI tổng quát để giảm sự chậm trễ giữa khi một người bị tê liệt nghiêm trọng cố gắng nói và khi thiết bị máy tính phát âm thanh. Công việc của họ đã giúp một người phụ nữ tên Ann, người bị đột quỵ não vào năm 2005 ở tuổi 30, để giao tiếp gần với thời gian thực. Ann nói với một giọng nói giống như của cô ấy bởi vì người mẫu được đào tạo trên các bản ghi âm của cô ấy từ trước khi cô ấy đột quỵ.
Việc triển khai Gen AI theo một vài cách khác nhau cho phép các nhà nghiên cứu thực hiện các cải tiến trong quá trình thần kinh có thể mất nhiều thời gian hơn, Cheol Jun Cho, một người UC Berkeley Ph.D. Sinh viên về kỹ thuật điện và khoa học máy tính và tác giả đồng đạo diễn của nghiên cứu, xuất hiện vào tháng 3 trong Nature Neuroscience.
Đó là một ví dụ về cách các công cụ AI tổng quát – sử dụng cùng một công nghệ cơ bản, cung cấp năng lượng cho các chatbot như nhà thờ của Openai và Claude hoặc phiên âm của Anthropic trong Google Meet – đang giúp các nhà nghiên cứu khoa học và y tế giải quyết các vấn đề có thể mất nhiều thời gian hơn để giải quyết, Cho nói với tôi. Các chuyên gia và người ủng hộ AI đã chỉ ra việc sử dụng công nghệ trong y học như một lĩnh vực có giá trị lớn, cho dù trong việc đưa ra các loại thuốc mới hoặc cung cấp xét nghiệm và chẩn đoán tốt hơn.
“AI đang tăng tốc tiến trình,” Cho nói. “Đôi khi chúng tôi đã tưởng tượng dòng thời gian sẽ là một hoặc hai thập kỷ. Bây giờ tốc độ đó giống như ba năm.”
Công nghệ đã giúp Ann là một bằng chứng về khái niệm, Cho nói, nhưng nó cho thấy một con đường hướng tới các công cụ có thể được cắm và chơi nhiều hơn trong tương lai.
Tăng tốc phát biểu
Vấn đề với thần kinh hiện có là độ trễ. Có độ trễ thời gian giữa khi người đó bắt đầu cố gắng nói và khi một câu thực sự được tạo và nghe. Cho cho biết công nghệ trước đó có nghĩa là Ann phải đợi cho đến khi một câu kết thúc trước khi bắt đầu tiếp theo.
Ann, được nhìn thấy trong nghiên cứu đầu tiên vào năm 2023, đã có thể giao tiếp thông qua các máy tính đọc các tín hiệu mà bộ não của cô đã cố gắng gửi đến các cơ kiểm soát lời nói.
“Bước đột phá lớn ở đây là cô ấy không cần phải đợi cho đến khi cô ấy kết thúc bản án,” anh nói. “Bây giờ chúng tôi thực sự có thể truyền phát thủ tục giải mã bất cứ khi nào cô ấy có ý định nói.”
Bộ phận giả bao gồm một mảng các điện cực được cấy trên bề mặt não của cô ấy và kết nối thông qua cáp với một ngân hàng máy tính. Nó giải mã các tín hiệu kiểm soát não của Ann gửi đến các cơ kiểm soát lời nói. Sau khi Ann đã chọn những từ mà cô dự định nói, một AI đọc những tín hiệu đó từ vỏ não vận động và mang lại cho họ sự sống.
Để đào tạo mô hình, nhóm đã cố gắng nói các câu được hiển thị trên một lời nhắc trên màn hình. Sau đó, họ đã sử dụng dữ liệu về hoạt động đó để ánh xạ các tín hiệu trong vỏ não, sử dụng Gen AI để điền vào các khoảng trống.
Cho cho biết nhóm hy vọng sự đột phá dẫn đến các thiết bị có thể mở rộng và dễ tiếp cận hơn.
“Chúng tôi vẫn đang trong những nỗ lực liên tục để làm cho nó chính xác và thấp hơn,” ông nói. “Chúng tôi đang cố gắng xây dựng một cái gì đó có thể cắm và chơi nhiều hơn.”
Sử dụng AI để đi từ suy nghĩ sang bài phát biểu
Cho cho biết nhóm đã sử dụng Gen AI theo một vài cách khác nhau. Một là sao chép giọng nói trước chấn thương của Ann. Họ đã sử dụng các bản ghi âm từ trước khi cô bị thương để đào tạo một mô hình có thể tạo ra âm thanh của giọng nói của cô.
“Cô ấy đã rất phấn khích khi lần đầu tiên nghe thấy giọng nói của chính mình”, Cho nói.
Sự thay đổi lớn là trong phiên âm thời gian thực. Cho so sánh nó với các công cụ phiên âm các bài thuyết trình hoặc các cuộc họp khi chúng xảy ra.
Công việc được xây dựng trên một nghiên cứu năm 2023 sử dụng các công cụ AI để giúp Ann giao tiếp. Công việc đó vẫn có một sự chậm trễ đáng kể giữa khi Ann cố gắng nói và khi các từ được tạo ra. Nghiên cứu này cắt giảm đáng kể sự chậm trễ, và Ann nói với nhóm rằng nó cảm thấy tự nhiên hơn.
“Cô ấy báo cáo rằng cô ấy cảm thấy thể hiện, đó là bài phát biểu của riêng cô ấy”, Cho nói.
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.