Nguồn hình ảnh: Được tạo bởi Unbounded AI
Stability AI, nhà phát triển Stable Diffusion (SD), một mô hình tạo hình ảnh mã nguồn mở, hôm nay đã công bố một số cải tiến mới cho nền tảng Stable Diffusion của mình. Những cập nhật này không chỉ cung cấp khả năng chuyển văn bản thành hình ảnh mới thú vị mà còn khai thác thế giới sáng tạo nội dung 3D.
Cải tiến đáng chú ý nhất là mô hình 3D ổn định hoàn toàn mới. Cho đến nay, Stable Diffusion tập trung chủ yếu vào việc tạo hình ảnh hai chiều (2D). Các mô hình 3D ổn định sẽ thay đổi điều đó, cung cấp các tính năng giúp tạo bất kỳ loại nội dung 3D nào, bao gồm thiết kế đồ họa và thậm chí phát triển trò chơi điện tử.
Đối với các nhà thiết kế đồ họa, nghệ sĩ kỹ thuật số và nhà phát triển trò chơi, tạo nội dung 3D có thể là một trong những nhiệm vụ phức tạp và tốn thời gian nhất, thường mất hàng giờ (và đôi khi vài ngày) để tạo ra một đối tượng 3D phức tạp vừa phải.
Khả năng của Stable 3D để tạo ra các đối tượng 3D có kết cấu chất lượng khái niệm từ hình ảnh hoặc hình minh họa hoặc bằng cách viết lời nhắc văn bản, loại bỏ phần lớn sự phức tạp và cho phép những người không phải là chuyên gia tạo mô hình 3D chất lượng dự thảo trong vài phút bằng cách chọn mô hình.
Các đối tượng được tạo bằng Stable 3D ở định dạng tệp tiêu chuẩn “.obj”, có thể được chỉnh sửa và tinh chỉnh thêm trong các công cụ 3D như Blender và Maya hoặc nhập vào các công cụ trò chơi như Unreal Engine 5 hoặc Unity. Giảm đáng kể khối lượng công việc của người sáng tạo.
3D ổn định cung cấp một môi trường sáng tạo nhanh chóng cho các nhà thiết kế, nghệ sĩ và nhà phát triển độc lập, cho phép họ tạo ra hàng ngàn đối tượng 3D mỗi ngày với một phần nhỏ chi phí.
Hiện tại, Stability AI chỉ mở cho bản xem trước riêng tư của Stable 3D, yêu cầu quyền truy cập
Ngoài bước đột phá vào thế hệ nội dung 3D, Stability AI cũng đã ra mắt công cụ Sky Replacer, được thiết kế để thực hiện chính xác những gì tên cho thấy - để thay thế nền trời trong hình ảnh 2D.
Nền tảng Stable Diffusion hiện cũng cung cấp Stable Fine-Tuning, được thiết kế để giúp các doanh nghiệp tăng tốc quá trình tinh chỉnh hình ảnh cho các trường hợp sử dụng cụ thể.
Ngoài ra, công ty sẽ tích hợp một hình mờ vô hình để xác thực nội dung trong hình ảnh được tạo bởi API AI ổn định. Khi AI tạo ra ngày càng trở thành một phần của quy trình làm việc phổ biến, các bản cập nhật mới này đều được thiết kế để giúp các doanh nghiệp phát triển sáng tạo.
Emad Mostaque, Giám đốc điều hành của Stability AI, cho biết trong một cuộc phỏng vấn: "Đó là về việc cung cấp cho những người kể chuyện sáng tạo những công cụ họ cần để kiểm soát thêm hình ảnh của họ. "
Sự ổn định Những tiến bộ của AI đến vào thời điểm thị trường tạo văn bản thành hình ảnh đang trở nên cạnh tranh hơn.
Adobe đã nhắm mục tiêu thị trường này với Firefly, một công cụ AI được tích hợp chặt chẽ với phần mềm thiết kế của công ty. Midjourney liên tục bổ sung các tính năng mới vào công nghệ của mình để giúp các nhà thiết kế tạo ra hình ảnh. Không thể bỏ qua, OpenAI gần đây đã phát hành mô hình DALL-E 3 gốc của ChatGPT, giúp cải thiện khả năng tạo văn bản trong hình ảnh.
Mostaque nhận thức rõ về sự cạnh tranh của mình và cam kết giúp AI ổn định nổi bật theo một số cách. Đặc biệt, ông nhấn mạnh rằng công ty của ông hiện đang chuyển từ chỉ cung cấp mô hình sang cung cấp một kênh cho các ý tưởng. Ông chỉ ra rằng với Sky Replacer mới và khả năng tinh chỉnh, tất cả chúng đều là các bước bổ sung ngoài mô hình cơ sở cốt lõi được sử dụng để tạo ra hình ảnh.
Sky Replacer không chỉ là một tính năng, nó còn tập trung vào các trường hợp sử dụng kinh doanh.
Khái niệm thay thế nền trong hình ảnh không phải là một khái niệm mới. Trong các ứng dụng AI không tạo ra, nền thường có thể được thay thế bằng các kỹ thuật như màn hình xanh lá cây và phím sắc độ.
Mostaque cho biết Stability AI đang xây dựng và tự động hóa quy trình làm việc trên các công nghệ cổ điển này để làm cho các quy trình nhanh chóng và hiệu quả cho người dùng doanh nghiệp. Thay đổi màu nền của bầu trời không chỉ là thêm một số hình thức tinh tế sáng tạo, đó là một tính năng với trường hợp sử dụng rất cụ thể và thiết thực.
“Sky Replacer, ví dụ, rất hữu ích cho bất động sản.”
Mostaque chỉ ra rằng người dùng muốn có thể có hình nền khác nhau và hiệu ứng ánh sáng khác nhau. Về cơ bản, ông nhấn mạnh, đó là tất cả về việc cung cấp quyền kiểm soát, vì các tổ chức có quy trình làm việc riêng để tạo ra hình ảnh và nội dung. Những gì AI ổn định đang làm là xây dựng quy trình làm việc được tối ưu hóa để giúp đạt được sự kiểm soát cần thiết cho các trường hợp sử dụng khác nhau.
“Sky Replacer là sản phẩm đầu tiên trong một loạt các sản phẩm mà chúng tôi sẽ tung ra rất cụ thể cho ngành và doanh nghiệp, dựa trên kinh nghiệm của chúng tôi trong 6 đến 12 tháng qua.”
Mô hình 3D ổn định mới hoạt động bằng cách mở rộng mô hình khuếch tán được sử dụng trong Khuếch tán ổn định để bao gồm các bộ dữ liệu 3D bổ sung và vectơ hóa.
“Tôi thực sự vui mừng khi có thể tạo ra cả thế giới dưới dạng 3D.”
Mostaque giải thích rằng Stable 3D được xây dựng dựa trên công việc của AI khuếch tán và ổn định ổn định trên Objaverse-XL, một trong những bộ dữ liệu 3D mở lớn nhất thế giới. Xây dựng và hiển thị hình ảnh 3D từ lâu đã là một quá trình tốn nhiều tài nguyên, nhưng Mostaque lạc quan rằng việc ổn định 3D sẽ hiệu quả hơn các phương pháp tạo hình ảnh 3D truyền thống. Ông nhấn mạnh rằng vẫn còn sớm để ổn định AI, nhưng ông lạc quan rằng công nghệ này sẽ phát triển và mở rộng đều đặn theo thời gian. 3D ổn định ban đầu có sẵn trong bản xem trước riêng tư.
"Điều này rất hiệu quả so với việc tạo mô hình 3D truyền thống. Những gì trước đây mất nhiều thời gian để xây dựng bây giờ nhận được sự chấp thuận đầu tiên rất nhanh chóng. "
Chính quyền Biden đã ban hành một lệnh hành pháp (EO) về trí tuệ nhân tạo trong tuần này và một thành phần của nó là tích hợp hình mờ vào nội dung được tạo.
Tính ổn định AI hiện đang tích hợp hình mờ vô hình và Thông tin xác thực nội dung vào API của nó. Thông tin xác thực nội dung là một nỗ lực trong ngành đa nhà cung cấp mà Adobe và những người khác tham gia để giúp cung cấp thông tin tác giả về nội dung. Mostaque nói rằng đó là một điều có trách nhiệm phải làm để thêm hình mờ vô hình và thông tin đăng nhập nội dung. Đây cũng là một phần trong nỗ lực rộng lớn hơn của Stability AI nhằm mang lại tính xác thực cho nội dung mà nó tạo ra.
“Chúng tôi thực sự đang triển khai một loạt các sáng kiến và một số sáng kiến bổ sung xung quanh vấn đề này, cũng như nghiên cứu bổ sung, bởi vì chúng tôi muốn biết điều gì là đúng và điều gì là giả”, Mostaque nói. Nó cũng giúp với một số phân bổ và các cơ chế khác mà chúng tôi đang xây dựng cho các bản phát hành trong tương lai. "
Tài nguyên: