Hệ thống nhận dạng tiếng nói tiếng Việt

Hệ thống nhận dạng tiếng nói (Speech to Text) nhận đầu vào là tín hiệu âm thanh và xuất ra văn bản tương ứng một cách tự động.

Nhận dạng thời gian thực

Với nhận dạng trực tiếp, kết quả trả về có độ trễ 0.5 giây. Với chuyển đổi tiếng nói trong tệp audio, thời gian nhận dạng nhỏ hơn 1/10 thời gian audio.​

Nhận dạng khoảng cách xa

Nhận dạng tốt ở khoảng cách xa: Ở khoảng cách gần độ chính xác có thể đạt 95%. Ở khoảng cách 2m-4m độ chính xác có thể đạt 90%.​

Nhận dạng Offline

Phát triển được kỹ thuật nhận dạng tiếng nói trên các thiết bị có cấu hình yếu mà không cần kết nối tới Server hay Internet. Phù hợp cho các giải pháp Smart device.​

Xử lý đa luồng

Hỗ trợ xử lý đa luồng, tại một thời điểm 1 CPU xử lý được 3 luồng tiếng nói đồng thời. Xử lý đa luồng tiết kiệm tài nguyên và tăng hiệu năng của hệ thống.