ByteDance công bố Seeduplex, mô hình giọng nói full-duplex “nghe và nói đồng thời”, nhằm cải thiện độ tự nhiên và mượt mà khi tương tác, và đã triển khai đầy đủ trên ứng dụng Doubao.
Seeduplex được giới thiệu như một thế hệ mô hình giọng nói native full-duplex, hướng đến trải nghiệm hội thoại thời gian thực với việc xử lý nghe và phản hồi diễn ra song song.
Theo thông tin công bố ngày 9/4, ByteDance cho biết Seeduplex sử dụng khung thiết kế mới “listen and speak simultaneously” (nghe và nói đồng thời). Thiết kế này nhắm đến việc nâng cấp chất lượng đối thoại so với mô hình giọng nói trước đó.
ByteDance so sánh Seeduplex với mô hình giọng nói end-to-end Doubao dạng half-duplex (bán song công) của thế hệ trước. Công ty nói rằng Seeduplex giúp tăng đáng kể độ tự nhiên và độ trôi chảy của trải nghiệm tương tác.
Hiện Seeduplex đã được mở đầy đủ trên Doubao App.


