(CNN) - Nhà lãnh đạo trí tuệ nhân tạo OpenAI đã giới thiệu một mô hình AI mới có tên Sora mà họ tuyên bố có thể tạo ra các video dài 60 giây “thực tế” và “giàu trí tưởng tượng” từ các lời nhắc văn bản nhanh.
Trong một bài đăng trên blog vào thứ Tư, công ty cho biết Sora có khả năng tạo video có độ dài lên tới 60 giây từ hướng dẫn bằng văn bản, với khả năng cung cấp các cảnh có nhiều nhân vật, các loại chuyển động cụ thể và chi tiết nền chi tiết.
Bài đăng trên blog cho biết: “Mô hình này không chỉ hiểu những gì người dùng yêu cầu trong lời nhắc mà còn hiểu những thứ đó tồn tại như thế nào trong thế giới vật chất”.
OpenAI cho biết họ dự định đào tạo các mô hình AI để có thể “giúp mọi người giải quyết các vấn đề đòi hỏi sự tương tác trong thế giới thực”.
Chủ tịch Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) Gary Gensler tham dự cuộc họp của Hội đồng Giám sát Ổn định Tài chính tại Bộ Tài chính Hoa Kỳ vào ngày 14 tháng 12 năm 2023 tại Washington, DC. Nhóm đã công bố báo cáo thường niên năm 2023, trong đó xem xét năm vừa qua về khí hậu, ngân hàng, an ninh mạng, trí tuệ nhân tạo, tiền điện tử và các vấn đề khác.
Đây là nỗ lực mới nhất của công ty đằng sau chatbot lan truyền ChatGPT , tiếp tục thúc đẩy phong trào AI sáng tạo về phía trước. Theo Reece Hayden, nhà phân tích cấp cao của công ty nghiên cứu thị trường ABI Research, mặc dù “các mô hình đa phương thức” không phải là mới và các mô hình chuyển văn bản thành video đã tồn tại, nhưng điều làm nên sự khác biệt của nó là độ dài và độ chính xác mà OpenAI tuyên bố Sora có. .
Hayden cho biết những loại mô hình AI này có thể có tác động lớn đến thị trường giải trí kỹ thuật số với nội dung được cá nhân hóa mới được truyền trực tuyến trên các kênh.
“Một trường hợp sử dụng rõ ràng là trong TV; tạo ra những cảnh ngắn để hỗ trợ cho câu chuyện,” Hayden nói. “Tuy nhiên, mô hình này vẫn còn hạn chế nhưng nó cho thấy hướng đi của thị trường.”
Đồng thời, OpenAI cho biết Sora vẫn đang trong quá trình hoàn thiện với những “điểm yếu” rõ ràng, đặc biệt là khi nói đến các chi tiết không gian của lời nhắc – trộn lẫn trái và phải – cũng như nguyên nhân và kết quả. Nó đưa ra ví dụ về việc tạo một video quay cảnh ai đó cắn một miếng bánh quy nhưng lại không có vết cắn ngay sau đó.
Hiện tại, thông điệp của OpenAI vẫn tập trung vào sự an toàn. Công ty cho biết họ có kế hoạch hợp tác với một nhóm chuyên gia để thử nghiệm mô hình mới nhất và xem xét kỹ lưỡng các lĩnh vực khác nhau bao gồm thông tin sai lệch, nội dung thù địch và thành kiến. Công ty cho biết họ cũng đang xây dựng các công cụ giúp phát hiện thông tin sai lệch.
Sora trước tiên sẽ được cung cấp cho các giáo sư an ninh mạng, được gọi là “đội đỏ”, những người có thể đánh giá sản phẩm về tác hại hoặc rủi ro. Nó cũng cấp quyền truy cập cho một số nghệ sĩ thị giác, nhà thiết kế và nhà làm phim để thu thập phản hồi về cách các chuyên gia sáng tạo có thể sử dụng nó.
Bản cập nhật mới nhất được đưa ra khi OpenAI tiếp tục phát triển ChatGPT.
Đầu tuần này, công ty cho biết họ đang thử nghiệm một tính năng trong đó người dùng có thể kiểm soát bộ nhớ của ChatGPT, cho phép họ yêu cầu nền tảng ghi nhớ các cuộc trò chuyện để làm cho các cuộc trò chuyện trong tương lai được cá nhân hóa hơn hoặc yêu cầu nó quên những gì đã thảo luận trước đó.
Đăng nhận xét