Công nghệ AI giọng nói tự động từ Singapore tác động đến ngành tổng đài tại Nhật Bản

Công nghệ AI giọng nói tự động từ Singapore tác động đến ngành tổng đài tại Nhật Bản

    Công nghệ AI giọng nói tự động từ Singapore tác động đến ngành tổng đài tại Nhật Bản

    Doanh nghiệp Singapore phát triển thành công AI giọng nói đa ngôn ngữ cho lĩnh vực BPO của Nhật Bản
    Ngày 28 tháng 10 năm 2025 – Singapore

    Một công ty phát triển AI tại Singapore vừa hoàn tất dự án AI giọng nói tự động đa ngôn ngữ dành cho nhà cung cấp dịch vụ BPO và tổng đài tại Nhật Bản, đánh dấu bước tiến quan trọng trong việc ứng dụng trí tuệ nhân tạo vào dịch vụ khách hàng tại châu Á.

    Functional AI Partners Pte Ltd (FunAi), có trụ sở tại Singapore do ông Getty Poon làm Giám đốc điều hành, phối hợp cùng elDesign, Inc. (Tokyo, CEO Kenichi Sakagoshi), đã phát triển Voice AI Agent có khả năng xử lý công việc tổng đài mà trước đây do con người đảm nhiệm – nay có thể thực hiện bằng nhiều ngôn ngữ khác nhau.

    Hệ thống này giúp giảm đáng kể chi phí vận hànhgiải quyết tình trạng thiếu hụt lao động trong bối cảnh xã hội Nhật đang già hóa. Kết quả mô phỏng cho thấy chi phí trung bình chỉ 0,67 USD/cuộc gọi (khoảng 101 yên), với mục tiêu hạ xuống 0,20 USD/cuộc gọi (khoảng 30 yên) trong tương lai.

    “Dự án này nhằm đánh giá mức độ mà các AI giọng nói tự động có thể hỗ trợ giải quyết các vấn đề cố hữu của ngành tổng đài Nhật Bản như dân số già, thiếu nhân lực và các hành vi quấy rối khách hàng,” ông Zenta Nishida, Trưởng nhóm phát triển cho biết.

    Bối cảnh

    Trong khi các tổng đài toàn cầu đang nhanh chóng ứng dụng AI giọng nói (chủ yếu tiếng Anh và tiếng Trung), thị trường Nhật Bản vẫn còn chậm do rào cản ngôn ngữ và văn hóa. Dự án này hướng tới giải pháp tổng đài tự động hoàn toàn, vượt ra khỏi giới hạn của hệ thống hướng dẫn thoại hoặc chatbot thông thường.

    Tổng quan phát triển

    Dự án được hoàn thành trong 1,5 tháng, sử dụng:

    • Ngôn ngữ: tiếng Nhật / tiếng Anh

    • Nền tảng: ElevenLabs (tổng hợp giọng nói), n8n (tự động hóa quy trình), Twilio (viễn thông)

    • Mô hình ngôn ngữ: Gemini, Grok

    • Kênh giao tiếp: thoại (SIP), email

    Lý do lựa chọn nền tảng:

    • ElevenLabs (Mỹ): hỗ trợ huấn luyện giọng nói tiếng Nhật chất lượng cao và đa ngôn ngữ.

    • n8n (Đức): linh hoạt, giao diện thân thiện, dễ quản lý.

    • Twilio (Mỹ): tương thích cao với hệ thống SIP của các tổng đài Nhật.

    “Thách thức lớn nhất là phát âm tiếng Nhật. Với sự hỗ trợ chuyên môn từ elDesign, chúng tôi đã huấn luyện được giọng nói riêng, chất lượng ngày càng cải thiện cùng tiến bộ công nghệ,” ông Nishida nói thêm.

    Tầm nhìn tương lai

    Môi trường trình diễn (demo) của dự án hiện đã sẵn sàng cho các doanh nghiệp tổng đài tại Nhật Bản. Hai công ty đặt mục tiêu đạt tỷ lệ ứng dụng AI 30% trong ngành tổng đài Nhật vào năm 2030, giúp các doanh nghiệp nghiên cứu, phát triển và giải quyết vấn đề vận hành hiệu quả hơn.

    Zalo
    Hotline