Hình thức cuối cùng của trợ lý AI? Tại sao các nhà đầu tư lại đổ 11 triệu đô la vào sản phẩm AI "nhìn trộm màn hình" này?

Viết bài: Leo

Bạn có nhận thấy rằng hiện tại các trợ lý AI đều khá “ngốc” không? Mỗi lần mở ChatGPT hoặc Claude, bạn đều phải giải thích lại bối cảnh một lần nữa. “Tôi đang làm một dự án về…”, “Nhóm của chúng tôi vừa họp, thảo luận về…”, “Tuần trước tôi gửi email, nội dung là…”. Bạn mất năm phút để viết câu lệnh hướng dẫn mới có thể nhận được một câu trả lời tạm được. Điều này thật kỳ lạ. AI không phải để làm công việc trở nên dễ dàng hơn sao? Tại sao lại làm tăng thêm khối lượng công việc của chúng ta?

Gần đây tôi đã trải nghiệm một sản phẩm gọi là Littlebird, vừa hoàn thành vòng gọi vốn hạt giống trị giá 11 triệu USD, do Lotus Studio dẫn đầu. Sản phẩm này khiến tôi phải suy nghĩ lại về một vấn đề: Trợ lý AI thực sự nên là dạng nào? Nó không nên là một công cụ cần bạn liên tục “bơm” thông tin vào, mà phải là một trợ lý đã hiểu rõ công việc và cuộc sống của bạn. Giống như một trợ lý thực thụ, không cần bạn phải giải thích lại toàn bộ nền tảng dự án, tình hình nhóm hay tiến trình công việc mỗi lần.

Người sáng lập Littlebird, Alexander Green, khi công bố vòng gọi vốn đã nói một câu tôi thấy rất chính xác: “Cảm giác sử dụng máy tính ngày càng giống như một cuộc đấu tranh.” Mỗi lần mở máy tính, chúng ta đều cảm nhận được sự kích thích từ dopamine và nỗi sợ hãi đan xen. Máy tính vốn dĩ nên là “xe đạp tư duy”, nhưng mô hình kinh doanh internet đã kết nối mọi thứ lại với nhau: nếu sản phẩm miễn phí, thì bạn chính là sản phẩm; nếu bạn là sản phẩm, mục tiêu là thu hút sự chú ý của bạn. Xe đạp bắt đầu phản lại chúng ta. Câu ví này quá chính xác. Chúng ta vốn dĩ nên kiểm soát công cụ, nhưng giờ đây chính công cụ lại kiểm soát chúng ta.

Tại sao trợ lý AI luôn “quên”

Tôi đã sử dụng các công cụ AI trong hơn nửa năm, từ ChatGPT đến Claude, từ Notion AI đến các trợ lý viết nội dung chuyên dụng. Mỗi công cụ đều rất mạnh mẽ, nhưng đều gặp chung một vấn đề: chúng hoàn toàn không biết tôi là ai, tôi đang làm gì, tôi quan tâm điều gì. Mỗi lần trò chuyện như lần gặp mặt lần đầu, tôi phải giới thiệu lại, giải thích bối cảnh, cung cấp ngữ cảnh.

Ví dụ cụ thể. Tuần trước tôi đang chuẩn bị một buổi ra mắt sản phẩm, liên quan đến nhiều bộ phận phối hợp. Tôi họp với đội thiết kế để thảo luận về phương án hình ảnh, họp với đội marketing để thống nhất chiến lược truyền thông, thảo luận với đội kỹ thuật về các chi tiết kỹ thuật trình diễn sản phẩm. Các ghi chú của các cuộc họp này phân tán ở nhiều nơi: có trong Notion, có trong email, có trong lời nói. Khi tôi muốn dùng AI giúp tổng hợp một kế hoạch ra mắt hoàn chỉnh, tôi phải làm gì? Tôi phải sao chép tất cả các thông tin này vào công cụ AI, viết một câu lệnh hướng dẫn dài dằng dặc, mô tả chi tiết nội dung và quyết định của từng cuộc họp. Chỉ để chuẩn bị câu lệnh này, tôi đã mất tới hai mươi phút.

Thật vô lý hơn nữa, ngày hôm sau tôi muốn chỉnh sửa kế hoạch, tôi lại phải làm lại từ đầu. Bởi vì AI không nhớ cuộc trò chuyện hôm qua, hoặc nếu có nhớ, cũng không biết chiều hôm trước tôi đã thảo luận với CEO về hướng đi mới. Trải nghiệm này khiến tôi cảm thấy, trợ lý AI không giúp tôi mà còn làm tăng thêm gánh nặng công việc. Tôi không chỉ phải làm công việc ban đầu, mà còn phải dành thời gian “dạy” AI hiểu công việc của mình.

Nhóm sáng lập Littlebird khi suy nghĩ về vấn đề này đã có một nhận thức quan trọng: Mô hình AI thực ra rất mạnh mẽ, giới hạn của chúng không phải do khả năng của mô hình, mà do thiếu dữ liệu về người dùng. Các mô hình ngôn ngữ lớn hoàn toàn không biết gì về bạn, điều này giới hạn tính thực dụng của chúng từ gốc rễ. Quan điểm này nghe có vẻ đơn giản, nhưng lại chạm đúng vào vấn đề cốt lõi. Chúng ta luôn bàn về cách làm cho mô hình thông minh hơn, nhưng lại bỏ qua một câu hỏi cơ bản hơn: làm thế nào để mô hình hiểu rõ người dùng.

Hiện nay trên thị trường có nhiều công cụ AI cố gắng giải quyết vấn đề ngữ cảnh. Có cái tập trung vào tìm kiếm tài liệu của bạn, có cái tập trung vào ghi chú cuộc họp, có cái tập trung vào sắp xếp email. Nhưng tất cả đều có một giới hạn chung: chúng chỉ nhìn thấy thông tin bạn chủ động cung cấp. Bạn phải tải tài liệu lên nền tảng của chúng, hoặc cấp quyền truy cập Gmail, hoặc mở chức năng ghi chú cuộc họp khi họp. Điều này vẫn đòi hỏi người dùng phải thực hiện nhiều thiết lập và bảo trì. Và quan trọng hơn, những công cụ này không thể nhìn thấy toàn bộ bức tranh công việc của bạn. Chúng có thể biết nội dung cuộc họp, nhưng không biết sau đó bạn thảo luận gì trên Slack; có thể biết email của bạn, nhưng không biết bạn đã nghiên cứu gì về đối thủ cạnh tranh trong trình duyệt.

Điểm khác biệt của Littlebird: công nghệ đọc màn hình

Littlebird áp dụng một phương pháp hoàn toàn khác, họ gọi là “screenreading” (đọc màn hình). Công nghệ này khiến tôi liên tưởng đến cách một trợ lý thực thụ làm việc. Một trợ lý xuất sắc không cần bạn phải nói rõ từng chi tiết, cô ấy sẽ quan sát công việc của bạn, ghi nhớ những điều quan trọng, và khi cần sẽ nhắc nhở bạn. Littlebird chính là đang làm điều tương tự.

Cụ thể, Littlebird là một ứng dụng trên Mac, liên tục đọc tất cả nội dung văn bản trên màn hình của bạn. Chú ý, là “đọc”, không phải “chụp màn hình”. Sự khác biệt này rất quan trọng. Trước đây có một số sản phẩm tương tự, như Rewind (sau này đổi tên thành Limitless và bị Meta mua lại) và Recall của Microsoft, cách làm của họ là chụp liên tục màn hình để lưu trữ. Phương pháp này có một số vấn đề: lượng dữ liệu lớn vì ảnh rất nặng; độ riêng tư kém vì chụp tất cả thông tin hình ảnh; trải nghiệm tìm kiếm kém vì trích xuất thông tin từ ảnh khó hơn nhiều so với từ văn bản.

Phương pháp của Littlebird thông minh hơn. Nó sử dụng công nghệ đọc màn hình phức tạp để hiểu tất cả nội dung văn bản trong các ứng dụng, không cần thiết lập rườm rà. Nó có thể hiểu ai nói gì, khi nào nói, theo dõi chi tiết tiến trình dự án của bạn. Qua đó, nó xây dựng được một hiểu biết phong phú về cuộc sống của bạn: ai quan trọng với bạn, bạn đang làm dự án gì, bạn quan tâm điều gì trong tuần này và trong năm. Người sáng lập Green khi phỏng vấn nói rằng, phương pháp này giúp dữ liệu nhẹ hơn nhiều và ít xâm phạm hơn.

Tôi đặc biệt thích điểm này vì nó tôn trọng bản chất của phần mềm. Nội dung hiển thị trên màn hình vốn dĩ đã là dữ liệu dạng văn bản và có cấu trúc, tại sao phải chuyển thành hình ảnh rồi lại chuyển ngược thành văn bản? Trực tiếp đọc nội dung có cấu trúc không những hiệu quả hơn, chính xác hơn. Và từ góc độ riêng tư, dữ liệu dạng văn bản ít nhạy cảm hơn nhiều so với dữ liệu hình ảnh. Mật khẩu của bạn có thể hiển thị dấu sao, số thẻ tín dụng có thể bị che đi, nhưng ảnh chụp màn hình sẽ lưu lại tất cả các chi tiết hình ảnh đó.

Littlebird sẽ tự động bỏ qua các trường nhạy cảm trong trình quản lý mật khẩu và biểu mẫu web, như mật khẩu, số thẻ tín dụng. Bạn cũng có thể tùy chỉnh để nó bỏ qua các ứng dụng nhất định. Điều này mang lại quyền kiểm soát lớn cho người dùng. Nếu không muốn Littlebird thấy công việc của bạn trong một ứng dụng nào đó, như phần mềm trò chuyện riêng tư hoặc phần mềm tài chính, bạn có thể dễ dàng loại trừ.

Ngoài việc đọc màn hình thụ động, Littlebird còn có thể chủ động kết nối với các ứng dụng khác. Bạn có thể chọn kết nối Gmail, Google Calendar, Apple Calendar và Reminders. Điều này giúp nó hiểu rõ hơn về công việc và cuộc sống của bạn. Nó không chỉ biết những gì xảy ra trên màn hình, mà còn biết lịch trình, danh sách công việc và email của bạn.

Ý nghĩa của AI toàn ngữ cảnh

Khi AI thực sự có được toàn bộ ngữ cảnh về bạn, trải nghiệm sử dụng sẽ thay đổi về chất. Tôi thấy một số kịch bản sử dụng của Littlebird khiến tôi nhận ra đây không chỉ là cải tiến dần dần, mà là một dạng tương tác hoàn toàn mới.

Chức năng cơ bản nhất là trả lời câu hỏi. Nhưng khác với các công cụ AI khác, câu trả lời của Littlebird dựa trên sự hiểu biết sâu sắc về công việc của bạn. Bạn có thể hỏi “Hôm nay tôi đã làm gì?”, hoặc “Những email nào quan trọng với tôi?”. Sau vài ngày sử dụng, các câu hỏi này sẽ trở nên ngày càng cá nhân hóa. Điều này rất thú vị, vì AI bắt đầu học hỏi về những điều bạn quan tâm, mô hình công việc của bạn.

Người sáng lập Green chia sẻ trải nghiệm của ông, tôi thấy rất rõ giá trị của AI toàn ngữ cảnh. Ông hàng ngày hỏi Littlebird “Tuần này điều gì quan trọng?” hoặc “Tôi nên tập trung vào gì?”, thường nhận được những câu trả lời bất ngờ và sâu sắc. Ông dùng nó để lấy lời khuyên chuyên môn, bù đắp kiến thức kỹ thuật còn thiếu, thậm chí để lên kế hoạch cho bữa tối. Các kịch bản này rất đa dạng, nhưng điểm chung là: AI có thể đưa ra câu trả lời có chiều sâu, vì nó hiểu rõ cuộc sống của bạn.

Littlebird tích hợp chức năng ghi chú cuộc họp tương tự Granola, chạy nền bằng âm thanh hệ thống, ghi lại bản ghi cuộc họp và tạo ghi chú, hành động dựa trên nội dung. Điều này không mới, có nhiều công cụ ghi chú cuộc họp trên thị trường. Nhưng điểm đặc biệt của Littlebird là nó có thể kết nối cuộc họp với các ngữ cảnh công việc khác của bạn.

Tôi đặc biệt quan tâm đến chức năng “Chuẩn bị cho cuộc họp”. Khi bạn mở chi tiết một cuộc họp, có một tùy chọn để Littlebird giúp bạn chuẩn bị cho cuộc họp đó. Nó sẽ xem xét ngữ cảnh các cuộc họp trước, email liên quan và lịch sử công ty, cung cấp cho bạn nhiều chi tiết hơn. Chức năng này thậm chí còn lấy thông tin từ Reddit hoặc các nguồn khác, cho biết ý kiến của người dùng về sản phẩm hoặc công ty đó. Tưởng tượng bạn sắp gặp khách hàng, Littlebird tự động tổng hợp: những gì đã thảo luận lần trước, các email trao đổi, tin tức mới nhất về công ty khách hàng, phản hồi của người dùng về sản phẩm của họ. Giống như có một trợ lý thực thụ đang giúp bạn chuẩn bị trước cuộc họp.

Ngoài ra còn có chức năng “Routines” (thói quen), cho phép bạn tạo các câu lệnh hướng dẫn chi tiết để Littlebird chạy định kỳ theo lịch trình cố định, như hàng ngày, hàng tuần hoặc hàng tháng. Công ty đã đưa ra một số thói quen sẵn, như bản tóm tắt hàng ngày, tổng kết hoạt động hàng tuần, tổng kết công việc hôm qua. Người dùng cũng có thể tự tạo thói quen riêng, kết hợp với lệnh tùy chỉnh. Tôi thấy chức năng này giải quyết một vấn đề thực tế: chúng ta đều biết cần phải định kỳ xem lại, tổng kết công việc, nhưng ít ai duy trì được. Với Routines, AI sẽ chủ động giúp bạn làm điều đó.

Đội ngũ của Littlebird đã tiến hành khảo sát nội bộ cho thấy giá trị thực của AI toàn ngữ cảnh: 84% người dùng báo cáo tiết kiệm ít nhất nửa ngày mỗi tuần, 80% cho biết sản phẩm giúp giảm căng thẳng trong công việc hàng ngày. Hai con số này rất thú vị. Tiết kiệm thời gian dễ hiểu vì bạn không cần mất thời gian sắp xếp, tìm kiếm tài liệu, nhớ lại chi tiết. Nhưng giảm căng thẳng mới thực sự sâu sắc. Nhiều lo lắng trong công việc xuất phát từ sợ bỏ lỡ thông tin quan trọng, quên mất việc cần làm, không phản hồi kịp thời. Khi bạn biết có AI theo dõi tất cả những điều này, cảm giác lo lắng sẽ giảm đi rõ rệt.

Cân bằng riêng tư và kiểm soát

Khi tôi biết rằng Littlebird có thể liên tục đọc tất cả nội dung trên màn hình của bạn, phản ứng đầu tiên của tôi là: Điều này có an toàn không? Có tiết lộ dữ liệu cá nhân không? Những lo lắng này hoàn toàn hợp lý. Nếu một ứng dụng phải quan sát toàn bộ ngày làm việc số của bạn, thì niềm tin là tất yếu.

Thiết kế của Littlebird là “mặc định bảo mật, riêng tư và kiểm soát của người dùng”. Về mặt kỹ thuật, họ đã làm một số việc để đảm bảo quyền riêng tư. Tất cả dữ liệu được mã hóa AES-256, truyền tải qua TLS 1.3. Dữ liệu của người dùng sẽ không bao giờ được dùng để huấn luyện mô hình AI. Đây là các biện pháp an toàn cơ bản, nhưng rất quan trọng đối với loại sản phẩm này.

Quan trọng hơn, quyền kiểm soát của người dùng. Bạn có thể tạm dừng thu thập dữ liệu bất cứ lúc nào, loại trừ các ứng dụng hoặc trang web cụ thể, hoặc xóa dữ liệu bất cứ lúc nào chỉ một cú nhấp chuột. Thiết kế này giúp người dùng luôn kiểm soát thông tin của mình. Nếu bạn xử lý nội dung cực kỳ nhạy cảm, có thể tạm thời dừng Littlebird; hoặc nếu không muốn nó theo dõi trong một số ứng dụng, có thể đưa vào danh sách đen.

Green giải thích lý do chọn lưu trữ đám mây thay vì lưu trữ cục bộ trong phỏng vấn: để chạy các mô hình mạnh mẽ, xử lý các quy trình AI khác nhau, thì không thể thực hiện trên thiết bị của người dùng. Đây là một sự cân nhắc thú vị. Lưu trữ cục bộ rõ ràng an toàn hơn vì dữ liệu không rời khỏi thiết bị của bạn, nhưng lưu trữ đám mây có thể dùng các mô hình AI mạnh hơn, cung cấp chức năng tốt hơn. Littlebird chọn phương án sau, nhưng bù đắp rủi ro an ninh bằng mã hóa mạnh và chính sách bảo mật nghiêm ngặt.

Tôi nhận thấy Littlebird đã đạt chứng nhận SOC 2, hoàn toàn phù hợp với GDPR và CCPA. Những chứng nhận và tuân thủ này không nhỏ, đặc biệt đối với một startup. Điều này cho thấy nhóm đã đặt an toàn và quyền riêng tư làm yêu cầu cốt lõi từ đầu, chứ không phải bổ sung sau này.

Một chi tiết tôi cho là rất quan trọng: Littlebird không lưu trữ bất kỳ dữ liệu hình ảnh nào, chỉ lưu trữ dữ liệu dạng văn bản. Điều này giúp giảm tải dữ liệu rất nhiều, đồng thời giảm thiểu xâm phạm quyền riêng tư. Green nói rằng, chính điều này có thể là lý do Recall và Rewind gặp khó khăn, vì dữ liệu chụp màn hình quá lớn. Hơn nữa, chụp màn hình thực sự xâm phạm hơn. Tưởng tượng bạn đang xem ảnh cá nhân hoặc video, chụp màn hình sẽ lưu lại tất cả các chi tiết hình ảnh đó. Trong khi ghi chú dạng văn bản chỉ ghi lại mô tả, không lưu hình ảnh.

Thiết kế này khiến tôi nghĩ đến một câu hỏi lớn hơn: chúng ta thực sự muốn AI hiểu chúng ta đến mức độ nào? Hoàn toàn minh bạch có thể mang lại tiện lợi tối đa, nhưng cũng đồng nghĩa với rủi ro lớn nhất. Phương pháp của Littlebird là để người dùng tự quyết định giới hạn này. Bạn có thể cho phép AI thấy tất cả, hoặc giới hạn quyền truy cập của nó. Sự linh hoạt này rất quan trọng, vì mỗi người, mỗi hoàn cảnh sử dụng đều có yêu cầu về quyền riêng tư khác nhau.

Điều này có ý nghĩa gì đối với các sản phẩm AI

Câu chuyện của Littlebird khiến tôi phải suy nghĩ lại về cách làm sản phẩm AI. Theo tôi, sản phẩm này thể hiện một số nguyên tắc quan trọng, đáng để tất cả các nhà phát triển AI suy ngẫm.

Nguyên tắc đầu tiên là tầm quan trọng của ngữ cảnh. Người đầu tư của Littlebird, Lenny Rachitsky, đã nói một câu tôi rất đồng tình: “Chất lượng của AI phụ thuộc vào ngữ cảnh nó có, còn nó hiểu về ngày của bạn quá ít.” Câu này chỉ rõ vấn đề cốt lõi của các sản phẩm AI hiện nay. Chúng ta luôn tối ưu mô hình, cải tiến thuật toán, nhưng bỏ qua một thực tế căn bản: AI dù thông minh đến đâu, nếu không hiểu rõ tình hình của người dùng, cũng không thể đưa ra câu trả lời thực sự hữu ích.

Điều này khiến tôi nhớ lại một sai lầm trong xây dựng các sản phẩm AI trước đây. Nhiều nhóm đang xây dựng hệ thống RAG (retrieval-augmented generation), cố gắng để AI truy cập vào nhiều nguồn dữ liệu khác nhau. Hướng đi này không sai, nhưng cách làm có thể chưa đúng. Thay vì bắt người dùng chủ động tải tài liệu, cấp quyền truy cập các ứng dụng, tại sao không để AI chủ động quan sát công việc của người dùng? Công nghệ đọc màn hình của Littlebird về bản chất là một cách thu thập ngữ cảnh thụ động nhưng toàn diện hơn, hiệu quả hơn so với các kết nối chủ động nhưng rời rạc.

Nguyên tắc thứ hai là tìm ra “use case” chủ đạo. Rachitsky nói rằng, thành công lâu dài của Littlebird phụ thuộc vào việc tìm ra một kịch bản sử dụng không thể thiếu. Ông nói nhiều người đã tìm ra được kịch bản đó cho riêng mình, và nhóm đang tập trung vào các trường hợp sử dụng mới nổi. Quan điểm này rất thực tế. Các nhóm phát triển AI thường mắc phải cái bẫy: cố gắng tạo ra một “công cụ toàn năng”, làm mọi thứ nhưng không chuyên sâu gì cả.

Rachitsky còn chia sẻ một triết lý phát triển sản phẩm thú vị: “Bạn sẽ không thực sự biết người dùng sử dụng sản phẩm của bạn như thế nào cho đến khi bạn ra mắt. Chiến lược là ra mắt sớm, xem họ dùng ra sao, rồi tập trung phát triển các kịch bản đó, chứ không đợi đến khi nghĩ hết mọi thứ mới ra mắt.” Khác với cách phát triển phần mềm truyền thống, nhấn mạnh kế hoạch, thiết kế, hoàn thiện rồi mới phát hành, sản phẩm AI giống như một cuộc thí nghiệm liên tục, vì khả năng của AI còn mơ hồ, người dùng sẽ khám phá ra cách dùng không ngờ tới.

Dựa trên phản hồi của nhà đầu tư, có thể thấy rõ các kịch bản sử dụng rất đa dạng. Russ Heddleston, CEO của DocSend, nói rằng ông dùng công cụ này để viết lại trang web marketing của công ty, dựa trên các ngữ cảnh từ cuộc họp, email, Notion. Gokul Rajaram, cựu trưởng bộ phận sản phẩm của Google và Facebook, nói rằng sản phẩm này giúp loại bỏ các rào cản trong ghi nhớ, truy xuất và giải thích lại công việc của chính mình. Rachitsky thì hỏi về cách nâng cao năng suất và hạnh phúc trong công việc.

Các kịch bản này rất đa dạng, từ viết nội dung marketing đến tối ưu hóa năng suất cá nhân, nhưng đều dựa trên một khả năng cốt lõi: AI hiểu rõ ngữ cảnh của người dùng. Điều này xác nhận giả thuyết cốt lõi của Littlebird: khi AI thực sự hiểu rõ ngữ cảnh của bạn, các ứng dụng sẽ tự nhiên xuất hiện, mà không cần nhóm phát triển phải lập kế hoạch trước.

Nguyên tắc thứ ba là sự tinh tế trong định vị sản phẩm. Littlebird tự định vị là “máy tính yên tĩnh của tương lai”. Cách diễn đạt này rất thơ mộng, nhưng cũng chính xác. Hiện nay phần lớn các sản phẩm AI đều cạnh tranh để giành lấy sự chú ý của bạn, bằng cách gửi thông báo, nhắc nhở, cố gắng khiến bạn sử dụng nhiều hơn. Nhưng ý tưởng của Littlebird là làm việc ở chế độ nền, chỉ xuất hiện khi bạn cần. Tính năng “yên tĩnh” này có thể là đặc trưng tất yếu của AI toàn ngữ cảnh. Nếu AI thực sự hiểu bạn, nó không cần phải liên tục làm phiền để lấy thông tin, mà có thể âm thầm học hỏi và chuẩn bị.

Hiện tại, mô hình kinh doanh của Littlebird là miễn phí, nhưng các tính năng cao cấp bắt đầu từ 20 USD/tháng. Mức giá này tôi thấy khá hợp lý, dựa trên giá trị mà nó mang lại. Nếu mỗi tuần giúp tiết kiệm nửa ngày, thì 20 USD/tháng là khoản đầu tư xứng đáng. Nhưng tôi tò mò hơn về khả năng phát triển của sản phẩm trong tương lai: phiên bản doanh nghiệp sẽ thế nào? Các chức năng hợp tác nhóm sẽ ra sao?

Suy nghĩ về tương lai

Sau khi trải nghiệm ý tưởng của Littlebird, tôi bắt đầu suy nghĩ về một câu hỏi lớn hơn: Trợ lý AI trong tương lai nên là dạng nào?

Tôi nghĩ chúng ta đang chứng kiến sự chuyển đổi từ “AI công cụ” sang “AI cộng sự”. AI công cụ như ChatGPT hiện tại, bạn cần mở ra khi cần, dùng xong rồi tắt, mỗi lần đều bắt đầu mới. AI cộng sự như Littlebird, luôn bên cạnh, hiểu rõ công việc và cuộc sống của bạn, có thể chủ động giúp đỡ. Đây không phải là khả năng, mà là mối quan hệ.

Chuyển đổi này sẽ mang lại những thay đổi thú vị. Ví dụ, chúng ta có thể không còn cần nhiều công cụ AI riêng biệt nữa. Hiện có các ứng dụng AI như trợ lý viết, trợ lý lập trình, trợ lý phân tích dữ liệu, trợ lý họp. Nhưng nếu có một AI thực sự hiểu tất cả công việc của bạn, nó có thể cung cấp sự giúp đỡ nhất quán trong các bối cảnh khác nhau, không cần chuyển đổi giữa nhiều công cụ.

Một thay đổi khác là việc thiết kế câu lệnh hướng dẫn (prompt engineering) có thể trở nên ít quan trọng hơn. Hiện chúng ta dành nhiều thời gian để học cách viết câu lệnh tốt, cung cấp đủ ngữ cảnh, hướng dẫn AI đúng ý. Nhưng nếu AI đã có đủ ngữ cảnh, chỉ cần diễn đạt ý định đơn giản là đủ. Giống như giao tiếp với trợ lý con người, không cần giải thích quá nhiều vì họ đã hiểu rõ rồi.

Tuy nhiên, AI toàn ngữ cảnh cũng mang đến những thách thức mới. Một là tâm lý thích nghi. Khi bạn biết có AI liên tục theo dõi công việc của mình, dù lý trí biết là an toàn, cảm xúc vẫn có thể không thoải mái. Cảm giác như có đồng nghiệp luôn nhìn màn hình của bạn vậy. Chúng ta cần thời gian để thích nghi với mối quan hệ mới này.

Thách thức thứ hai là sự phụ thuộc. Khi đã quen dựa vào AI để ghi nhớ, sắp xếp, chuẩn bị mọi thứ, khả năng ghi nhớ và tổ chức của bạn có thể suy giảm. Giống như GPS ảnh hưởng đến khả năng định hướng của chúng ta. Nhiều người hiện nay đã phụ thuộc hoàn toàn vào định vị, khả năng tự tìm đường giảm đi rõ rệt. Liệu AI trợ lý có gây ra hiệu ứng tương tự không?

Về mặt ngành, tôi nghĩ Littlebird đại diện cho một loại sản phẩm mới: không phải là công cụ ghi chú cuộc họp, không phải là công cụ tìm kiếm tài liệu, mà là “trợ lý AI toàn ngữ cảnh”. Đặc trưng của loại này là: liên tục quan sát, hiểu toàn diện, chủ động phục vụ. Tôi dự đoán sẽ có nhiều công ty tham gia vào lĩnh vực này, cạnh tranh theo các chiều: ai thu thập ngữ cảnh toàn diện hơn? AI hiểu chính xác hơn? Bảo mật quyền riêng tư tốt hơn?

Vòng gọi vốn 11 triệu USD của Littlebird chỉ mới bắt đầu. Các nhà đầu tư rất đa dạng, gồm các chuyên gia trong lĩnh vực sản phẩm, thiết kế, nội dung. Họ không chỉ cung cấp vốn, mà còn là người dùng thực sự, có thể đưa ra phản hồi và đề xuất các kịch bản sử dụng. Cấu trúc nhà đầu tư này có thể mang lại giá trị lớn hơn cả vốn đầu tư thuần túy cho một sản phẩm AI cần liên tục thử nghiệm và khám phá các cách dùng mới.

Tôi rất mong chờ sự phát triển tiếp theo của Littlebird. Liệu nó có mở rộng ra Windows và các nền tảng khác? Có thể ra mắt phiên bản doanh nghiệp để chia sẻ ngữ cảnh trong nhóm? Có thể phát triển các tính năng mới mà chúng ta chưa hình dung ra? Và quan trọng nhất, liệu nó có thể thực sự tìm ra “use case” chủ đạo khiến người dùng cảm thấy “không thể làm việc nếu không có nó”?

Green khi công bố vòng gọi vốn đã nói: “Liệu có thể xây dựng một AI thực sự hiểu bạn không? Chúng tôi tin là có, và rất muốn chứng minh điều đó cho bạn xem.” Câu này vừa là lời hứa, vừa là thử thách. Littlebird còn đang trong giai đoạn đầu, vẫn đang phát triển, là một dự án nghiên cứu liên tục. Nó không thể luôn chính xác nắm bắt mọi chi tiết, thỉnh thoảng sẽ bỏ lỡ đồng nghiệp đang nghỉ phép hoặc dự án đã hoàn thành. Nhưng bạn sẽ ngạc nhiên về mức độ hiểu biết của nó về bạn.

Tôi tin rằng AI toàn ngữ cảnh chính là hướng đi của tương lai. Không phải vì công nghệ quá đẹp mắt, mà vì đó mới là hình dạng đúng đắn của AI. AI hứa hẹn giúp chúng ta hiệu quả hơn, tập trung hơn, sáng tạo hơn. Nhưng nếu AI cần quá nhiều công sức của con người để duy trì và cung cấp dữ liệu, thì nó đã phản bội lời hứa đó. Chỉ khi AI thực sự hiểu và thích nghi với chúng ta, nó mới có thể trở thành “xe đạp tư duy”, giúp chúng ta đi nhanh hơn, xa hơn.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim