Viễn cảnh của a16z cho năm tới không chỉ là một dự đoán đơn thuần, mà là bản đồ tương lai đã và đang hình thành. Quỹ đầu tư mạo hiểm của Mỹ đã vạch ra ba chuyển đổi căn bản sẽ định hình lại toàn bộ hệ sinh thái công nghệ: giao diện người dùng sẽ biến mất, thiết kế sẽ hướng tới các đại lý thay vì người dùng, và giọng nói nhân tạo sẽ từ thử nghiệm chuyển sang thị trường đại chúng.
Kết thúc thời đại prompt: khi người dùng không còn phải gõ nữa
Marc Andrusko, nhà đầu tư trong lĩnh vực ứng dụng AI, khẳng định chắc chắn: đến năm 2026, ô nhập liệu sẽ biến mất như giao diện chính. Đây không phải là phóng đại, mà là sự tiến hóa tự nhiên của phần mềm thông minh.
Hiện tại, người dùng buộc phải tạo ra các prompt phức tạp, xác định rõ AI cần làm gì. Ngày mai, sẽ ngược lại: đại lý sẽ quan sát hành vi của bạn, dự đoán nhu cầu, chuẩn bị các kế hoạch hành động và chỉ yêu cầu bạn phê duyệt cuối cùng.
Cấu trúc phân cấp vai trò doanh nghiệp truyền thống thể hiện rõ điều này. Một nhân viên ít chủ động sẽ phát hiện vấn đề và yêu cầu giúp đỡ. Một nhân viên “cấp S”—mức độ chủ động cao nhất—tự chẩn đoán, đề xuất giải pháp, thực hiện và trình kết quả để xác nhận. Đây sẽ là hành vi của các đại lý AI trong phần mềm tương lai.
Nhưng còn một con số còn quan trọng hơn phía sau tầm nhìn này: thị trường mục tiêu đang mở rộng gấp 30 lần. Trước đây, phần mềm doanh nghiệp trị giá 300-400 tỷ đô la mỗi năm toàn cầu. Giờ đây, a16z hướng tới 13 nghìn tỷ đô la chi tiêu cho nguồn nhân lực chỉ riêng tại Mỹ. Nếu các đại lý AI có thể thực hiện công việc của con người—với độ tin cậy tương đương hoặc cao hơn—thì bài toán kinh doanh trở nên không thể cưỡng lại.
Hãy tưởng tượng CRM của tương lai: đại lý không chờ nhân viên bán hàng mở chương trình và chọn hành động. Nó tự nghiên cứu các cơ hội mở, quét email trong hai năm qua để xác định các khách hàng tiềm năng bỏ rơi, đề xuất các thời điểm liên hệ tối ưu, soạn tin nhắn cá nhân hóa. Con người chỉ cần nhấn “phê duyệt”.
Machine legibility: thiết kế không còn dành cho mắt người nữa
Stephanie Zhang đã giới thiệu một khái niệm gây sốc: phần mềm đang ngừng được thiết kế cho con người và bắt đầu tối ưu cho máy móc.
Trong nhiều thập kỷ, nhà thiết kế và marketer theo các quy tắc đơn giản: bắt đầu bài viết với 5W và 1H (ai, khi, ở đâu, cái gì, tại sao, như thế nào), đặt từ khóa trong tiêu đề, làm mọi thứ hấp dẫn về mặt thị giác. Tại sao? Bởi vì sự chú ý của con người có giới hạn và chọn lọc.
Nhưng các đại lý thì không. Một đại lý đọc toàn bộ nội dung bài viết cùng lúc. Nó không bỏ qua đoạn thứ hai. Không bị phân tâm bởi màu nền. Đối với các đại lý, tối ưu hóa hình ảnh là không quan trọng; điều quan trọng là khả năng đọc hiểu của máy.
Điều này thay đổi căn bản cách tạo nội dung. Nếu các đại lý không tìm kiếm yếu tố hình ảnh mà trích xuất ý nghĩa thuần túy từ văn bản, chi phí sản xuất nội dung sẽ giảm mạnh. Có thể xuất hiện một hiện tượng trái ngược với nghiên cứu truyền thống: thay vì các bài viết dài và sâu sắc, các thương hiệu và nền tảng sẽ bắt đầu tạo ra lượng lớn micro-content siêu chuyên biệt, tối ưu cho những gì các đại lý thích đọc. Đó là “keyword stuffing của thời đại đại lý”.
Stephanie đã quan sát thấy một sự thay đổi đã và đang diễn ra: các nhóm SRE (Site Reliability Engineer) không còn mở dashboard telemetry để hiểu chuyện gì đã xảy ra nữa. AI phân tích dữ liệu và gửi báo cáo tóm tắt trực tiếp lên Slack. Các nhóm bán hàng không còn duyệt CRM nữa; các đại lý trích xuất dữ liệu và xử lý giúp họ.
Voice AI: từ phòng thí nghiệm đến hoạt động quy mô lớn
Olivia Moore đã báo cáo một thay đổi còn thực tế hơn nữa: đại lý thoại không còn là viễn tưởng, đã đi vào sản xuất rồi. Đến năm 2025, hàng chục công ty thực tế đã mua và triển khai chúng. Năm 2026 sẽ là năm bùng nổ.
Ngành y tế là lĩnh vực tiên phong. Các đại lý thoại xử lý các cuộc gọi với các công ty bảo hiểm, nhà thuốc, nhà cung cấp dịch vụ, và—đáng ngạc nhiên—bệnh nhân. Lập lịch khám, gửi nhắc nhở, quản lý theo dõi hậu phẫu, hỗ trợ các cuộc tư vấn tâm thần ban đầu. Động lực chính? Tỷ lệ thay thế nhân viên trong ngành y tế khiến các đại lý thoại trở thành giải pháp không thể thiếu về mặt kinh tế.
Thú vị hơn nữa là ngành ngân hàng và tài chính. Có vẻ như đây là lĩnh vực mà quy định sẽ kìm hãm mọi tự động hóa. Nhưng thực tế lại ngược lại: voice AI vượt qua con người trong tuân thủ quy định. Con người tìm cách lách luật, đàm phán quy tắc, diễn giải hướng dẫn. Các đại lý thoại thì không: thực thi các quy trình chính xác đến 100%. Và, điều quan trọng là mọi tương tác đều được ghi lại và có thể kiểm tra.
Trong tuyển dụng, voice AI cho phép ứng viên tham gia phỏng vấn sơ bộ bất cứ lúc nào phù hợp, rồi tích hợp các ứng viên tiềm năng vào quy trình nhân sự.
Với sự cải thiện của các mô hình nền vào năm 2025, độ chính xác và độ trễ đã đạt mức đáng kinh ngạc. Một số công ty voice AI phải chậm lại có chủ đích hoặc thêm tiếng ồn nền để khiến chúng trông “như người” hơn trong mắt người nghe.
Hiệu ứng domino trên trung tâm cuộc gọi và BPO
Câu nói của Olivia tóm tắt sự đột phá: “AI không lấy đi công việc của bạn, nhưng người dùng AI thì có”.
Các trung tâm cuộc gọi truyền thống và các công ty BPO (Business Process Outsourcing) sẽ trải qua quá trình chuyển đổi. Trong ngắn hạn, nhiều khách hàng vẫn thích mua dịch vụ quản lý hơn là tự triển khai công nghệ. Nhưng họ sẽ chọn các nhà cung cấp có giá thấp hơn hoặc quản lý khối lượng lớn hơn nhờ tích hợp voice AI.
Ở một số khu vực trên thế giới, chi phí cho một nhân viên con người vẫn thấp hơn voice AI tốt nhất hiện nay. Nhưng khi các mô hình ngày càng tốt hơn và chi phí giảm xuống, lợi thế này sẽ biến mất. Các thị trường nơi lao động thủ công đắt hơn sẽ bị đe dọa đầu tiên.
Một nhận xét cuối cùng: voice AI vượt trội trong các cuộc hội thoại đa ngôn ngữ và có giọng điệu đặc trưng. Nhiều nhà cung cấp ASR (Automatic Speech Recognition) đã đạt đến mức độ chính xác vượt qua khả năng hiểu của con người trong các tình huống có tiếng ồn hoặc biến đổi ngôn ngữ.
Tương lai ngoài B2B: chính phủ, y tế, phúc lợi
Olivia đã nêu ra các trường hợp sử dụng chính phủ còn chưa được khám phá: nếu một đại lý thoại xử lý các cuộc gọi không khẩn cấp đến 911, nó cũng có thể xử lý các hàng dài và bực bội của DMV (Department of Motor Vehicles) và các dịch vụ công khác. Đây là cơ hội lớn để nâng cao dịch vụ với chi phí thấp hơn.
Trong lĩnh vực tiêu dùng, các trợ lý thoại đang xuất hiện trong các trung tâm hỗ trợ và nhà dưỡng lão, hoạt động như bạn đồng hành cho cư dân và như các thiết bị giám sát thụ động các chỉ số sức khỏe theo thời gian.
Cấu trúc cơ hội: từ công nghệ đến ngành công nghiệp
Một nhận xét cuối cùng cực kỳ quan trọng: voice AI không phải là một thị trường đơn lẻ, mà là toàn bộ một ngành công nghiệp. Sẽ có các nhà chiến thắng ở mọi cấp của hệ sinh thái công nghệ—từ các mô hình nền đến nền tảng, từ các tích hợp dọc đến dịch vụ chuyên nghiệp.
Nếu tầm nhìn của a16z đúng, 12 tháng tới sẽ đánh dấu thời điểm phần mềm chuyển từ “công cụ phản hồi lệnh” sang “nhân viên kỹ thuật số dự đoán nhu cầu”. Không còn giao diện nhập liệu nữa, mà là các luồng thực thi liên tục. Không còn thiết kế dành cho mắt người nữa, mà tối ưu hóa cho đọc tự động. Không còn voice AI như một sự tò mò công nghệ, mà trở thành hạ tầng quan trọng trong y tế, tài chính và chính quyền.
Cấu trúc vai trò doanh nghiệp truyền thống—từ cấp nhân viên phản ứng cơ bản đến cấp “S” tối đa chủ động—dự kiến sẽ trở thành bản thiết kế của các hệ thống thông minh trong thập kỷ tới.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
AI 2026: Cách các đại lý đang biến phần mềm từ công cụ thụ động thành nhân viên kỹ thuật số
Viễn cảnh của a16z cho năm tới không chỉ là một dự đoán đơn thuần, mà là bản đồ tương lai đã và đang hình thành. Quỹ đầu tư mạo hiểm của Mỹ đã vạch ra ba chuyển đổi căn bản sẽ định hình lại toàn bộ hệ sinh thái công nghệ: giao diện người dùng sẽ biến mất, thiết kế sẽ hướng tới các đại lý thay vì người dùng, và giọng nói nhân tạo sẽ từ thử nghiệm chuyển sang thị trường đại chúng.
Kết thúc thời đại prompt: khi người dùng không còn phải gõ nữa
Marc Andrusko, nhà đầu tư trong lĩnh vực ứng dụng AI, khẳng định chắc chắn: đến năm 2026, ô nhập liệu sẽ biến mất như giao diện chính. Đây không phải là phóng đại, mà là sự tiến hóa tự nhiên của phần mềm thông minh.
Hiện tại, người dùng buộc phải tạo ra các prompt phức tạp, xác định rõ AI cần làm gì. Ngày mai, sẽ ngược lại: đại lý sẽ quan sát hành vi của bạn, dự đoán nhu cầu, chuẩn bị các kế hoạch hành động và chỉ yêu cầu bạn phê duyệt cuối cùng.
Cấu trúc phân cấp vai trò doanh nghiệp truyền thống thể hiện rõ điều này. Một nhân viên ít chủ động sẽ phát hiện vấn đề và yêu cầu giúp đỡ. Một nhân viên “cấp S”—mức độ chủ động cao nhất—tự chẩn đoán, đề xuất giải pháp, thực hiện và trình kết quả để xác nhận. Đây sẽ là hành vi của các đại lý AI trong phần mềm tương lai.
Nhưng còn một con số còn quan trọng hơn phía sau tầm nhìn này: thị trường mục tiêu đang mở rộng gấp 30 lần. Trước đây, phần mềm doanh nghiệp trị giá 300-400 tỷ đô la mỗi năm toàn cầu. Giờ đây, a16z hướng tới 13 nghìn tỷ đô la chi tiêu cho nguồn nhân lực chỉ riêng tại Mỹ. Nếu các đại lý AI có thể thực hiện công việc của con người—với độ tin cậy tương đương hoặc cao hơn—thì bài toán kinh doanh trở nên không thể cưỡng lại.
Hãy tưởng tượng CRM của tương lai: đại lý không chờ nhân viên bán hàng mở chương trình và chọn hành động. Nó tự nghiên cứu các cơ hội mở, quét email trong hai năm qua để xác định các khách hàng tiềm năng bỏ rơi, đề xuất các thời điểm liên hệ tối ưu, soạn tin nhắn cá nhân hóa. Con người chỉ cần nhấn “phê duyệt”.
Machine legibility: thiết kế không còn dành cho mắt người nữa
Stephanie Zhang đã giới thiệu một khái niệm gây sốc: phần mềm đang ngừng được thiết kế cho con người và bắt đầu tối ưu cho máy móc.
Trong nhiều thập kỷ, nhà thiết kế và marketer theo các quy tắc đơn giản: bắt đầu bài viết với 5W và 1H (ai, khi, ở đâu, cái gì, tại sao, như thế nào), đặt từ khóa trong tiêu đề, làm mọi thứ hấp dẫn về mặt thị giác. Tại sao? Bởi vì sự chú ý của con người có giới hạn và chọn lọc.
Nhưng các đại lý thì không. Một đại lý đọc toàn bộ nội dung bài viết cùng lúc. Nó không bỏ qua đoạn thứ hai. Không bị phân tâm bởi màu nền. Đối với các đại lý, tối ưu hóa hình ảnh là không quan trọng; điều quan trọng là khả năng đọc hiểu của máy.
Điều này thay đổi căn bản cách tạo nội dung. Nếu các đại lý không tìm kiếm yếu tố hình ảnh mà trích xuất ý nghĩa thuần túy từ văn bản, chi phí sản xuất nội dung sẽ giảm mạnh. Có thể xuất hiện một hiện tượng trái ngược với nghiên cứu truyền thống: thay vì các bài viết dài và sâu sắc, các thương hiệu và nền tảng sẽ bắt đầu tạo ra lượng lớn micro-content siêu chuyên biệt, tối ưu cho những gì các đại lý thích đọc. Đó là “keyword stuffing của thời đại đại lý”.
Stephanie đã quan sát thấy một sự thay đổi đã và đang diễn ra: các nhóm SRE (Site Reliability Engineer) không còn mở dashboard telemetry để hiểu chuyện gì đã xảy ra nữa. AI phân tích dữ liệu và gửi báo cáo tóm tắt trực tiếp lên Slack. Các nhóm bán hàng không còn duyệt CRM nữa; các đại lý trích xuất dữ liệu và xử lý giúp họ.
Voice AI: từ phòng thí nghiệm đến hoạt động quy mô lớn
Olivia Moore đã báo cáo một thay đổi còn thực tế hơn nữa: đại lý thoại không còn là viễn tưởng, đã đi vào sản xuất rồi. Đến năm 2025, hàng chục công ty thực tế đã mua và triển khai chúng. Năm 2026 sẽ là năm bùng nổ.
Ngành y tế là lĩnh vực tiên phong. Các đại lý thoại xử lý các cuộc gọi với các công ty bảo hiểm, nhà thuốc, nhà cung cấp dịch vụ, và—đáng ngạc nhiên—bệnh nhân. Lập lịch khám, gửi nhắc nhở, quản lý theo dõi hậu phẫu, hỗ trợ các cuộc tư vấn tâm thần ban đầu. Động lực chính? Tỷ lệ thay thế nhân viên trong ngành y tế khiến các đại lý thoại trở thành giải pháp không thể thiếu về mặt kinh tế.
Thú vị hơn nữa là ngành ngân hàng và tài chính. Có vẻ như đây là lĩnh vực mà quy định sẽ kìm hãm mọi tự động hóa. Nhưng thực tế lại ngược lại: voice AI vượt qua con người trong tuân thủ quy định. Con người tìm cách lách luật, đàm phán quy tắc, diễn giải hướng dẫn. Các đại lý thoại thì không: thực thi các quy trình chính xác đến 100%. Và, điều quan trọng là mọi tương tác đều được ghi lại và có thể kiểm tra.
Trong tuyển dụng, voice AI cho phép ứng viên tham gia phỏng vấn sơ bộ bất cứ lúc nào phù hợp, rồi tích hợp các ứng viên tiềm năng vào quy trình nhân sự.
Với sự cải thiện của các mô hình nền vào năm 2025, độ chính xác và độ trễ đã đạt mức đáng kinh ngạc. Một số công ty voice AI phải chậm lại có chủ đích hoặc thêm tiếng ồn nền để khiến chúng trông “như người” hơn trong mắt người nghe.
Hiệu ứng domino trên trung tâm cuộc gọi và BPO
Câu nói của Olivia tóm tắt sự đột phá: “AI không lấy đi công việc của bạn, nhưng người dùng AI thì có”.
Các trung tâm cuộc gọi truyền thống và các công ty BPO (Business Process Outsourcing) sẽ trải qua quá trình chuyển đổi. Trong ngắn hạn, nhiều khách hàng vẫn thích mua dịch vụ quản lý hơn là tự triển khai công nghệ. Nhưng họ sẽ chọn các nhà cung cấp có giá thấp hơn hoặc quản lý khối lượng lớn hơn nhờ tích hợp voice AI.
Ở một số khu vực trên thế giới, chi phí cho một nhân viên con người vẫn thấp hơn voice AI tốt nhất hiện nay. Nhưng khi các mô hình ngày càng tốt hơn và chi phí giảm xuống, lợi thế này sẽ biến mất. Các thị trường nơi lao động thủ công đắt hơn sẽ bị đe dọa đầu tiên.
Một nhận xét cuối cùng: voice AI vượt trội trong các cuộc hội thoại đa ngôn ngữ và có giọng điệu đặc trưng. Nhiều nhà cung cấp ASR (Automatic Speech Recognition) đã đạt đến mức độ chính xác vượt qua khả năng hiểu của con người trong các tình huống có tiếng ồn hoặc biến đổi ngôn ngữ.
Tương lai ngoài B2B: chính phủ, y tế, phúc lợi
Olivia đã nêu ra các trường hợp sử dụng chính phủ còn chưa được khám phá: nếu một đại lý thoại xử lý các cuộc gọi không khẩn cấp đến 911, nó cũng có thể xử lý các hàng dài và bực bội của DMV (Department of Motor Vehicles) và các dịch vụ công khác. Đây là cơ hội lớn để nâng cao dịch vụ với chi phí thấp hơn.
Trong lĩnh vực tiêu dùng, các trợ lý thoại đang xuất hiện trong các trung tâm hỗ trợ và nhà dưỡng lão, hoạt động như bạn đồng hành cho cư dân và như các thiết bị giám sát thụ động các chỉ số sức khỏe theo thời gian.
Cấu trúc cơ hội: từ công nghệ đến ngành công nghiệp
Một nhận xét cuối cùng cực kỳ quan trọng: voice AI không phải là một thị trường đơn lẻ, mà là toàn bộ một ngành công nghiệp. Sẽ có các nhà chiến thắng ở mọi cấp của hệ sinh thái công nghệ—từ các mô hình nền đến nền tảng, từ các tích hợp dọc đến dịch vụ chuyên nghiệp.
Nếu tầm nhìn của a16z đúng, 12 tháng tới sẽ đánh dấu thời điểm phần mềm chuyển từ “công cụ phản hồi lệnh” sang “nhân viên kỹ thuật số dự đoán nhu cầu”. Không còn giao diện nhập liệu nữa, mà là các luồng thực thi liên tục. Không còn thiết kế dành cho mắt người nữa, mà tối ưu hóa cho đọc tự động. Không còn voice AI như một sự tò mò công nghệ, mà trở thành hạ tầng quan trọng trong y tế, tài chính và chính quyền.
Cấu trúc vai trò doanh nghiệp truyền thống—từ cấp nhân viên phản ứng cơ bản đến cấp “S” tối đa chủ động—dự kiến sẽ trở thành bản thiết kế của các hệ thống thông minh trong thập kỷ tới.