V1 là mô hình chuyển từ ảnh sang video (image-to-video), cho phép người dùng tải lên một hình ảnh hoặc sử dụng hình ảnh được tạo từ các mô hình khác của Midjourney, và nhận lại bốn đoạn video dài 5 giây được tạo dựa trên hình ảnh đó. Tương tự như các mô hình tạo ảnh của Midjourney, V1 chỉ có thể sử dụng qua nền tảng Discord và hiện chỉ hỗ trợ truy cập trên trình duyệt web.
Với việc ra mắt V1, Midjourney đã chính thức bước vào cuộc cạnh tranh trực tiếp với loạt mô hình tạo video AI khác như Sora của OpenAI, Gen-4 của Runway, Firefly của Adobe hay Veo 3 của Google. Trong khi nhiều công ty đang tập trung phát triển các mô hình video AI có thể kiểm soát chi tiết (controllable models) để ứng dụng trong lĩnh vực thương mại, Midjourney lại đi theo hướng phục vụ giới sáng tạo nghệ thuật bằng những hình ảnh khác biệt đầy tính nghệ thuật.
Trong một bài đăng blog, CEO của Midjourney, ông David Holz cho biết mục tiêu dài hạn của công ty không chỉ dừng lại ở việc tạo video minh họa (B-roll) cho phim Hollywood hay các video quảng cáo, mà là tiến tới xây dựng mô hình AI có khả năng mô phỏng thế giới mở theo thời gian thực (real-time open-world simulation).
Midjourney cho biết sau khi hoàn thiện mô hình tạo video, họ sẽ tiếp tục phát triển các mô hình AI tạo đồ họa 3D và mô hình có thể hoạt động thời gian thực.
V1 ra mắt chỉ một tuần sau khi Midjourney bị hai hãng phim lớn của Hollywood là Disney và Universal kiện với cáo buộc sử dụng hình ảnh nhân vật có bản quyền của họ như Homer Simpson hay Darth Vader.
Giữa làn sóng tranh cãi ngày càng tăng quanh việc AI có thể thay thế công việc sáng tạo và sử dụng dữ liệu có bản quyền để huấn luyện mô hình, dù định vị mình là nền tảng ưu tiên sáng tạo, Midjourney cũng không tránh khỏi chỉ trích.
Trong giai đoạn ra mắt, Midjourney sẽ tính phí tạo video cao gấp 8 lần so với tạo ảnh thông thường. Điều này có nghĩa là người dùng sẽ nhanh chóng tiêu hết giới hạn số lượt sử dụng hàng tháng nếu chọn tạo video thay vì ảnh.
Hiện tại, gói rẻ nhất để trải nghiệm V1 là gói Basic trị giá $10/tháng. Với gói Pro ($60/tháng) và Mega ($120/tháng), người dùng có thể tạo video không giới hạn ở chế độ “Relax”. Midjourney cho biết họ sẽ xem xét lại chính sách giá vào tháng sau.
V1 cũng hỗ trợ một số tùy chọn giúp người dùng kiểm soát kết quả video đầu ra: Người dùng có thể chọn chế độ tự động tạo chuyển động cho hình ảnh hoặc tùy chỉnh bằng văn bản để mô tả cụ thể chuyển động mong muốn trong video. Người dùng cũng có thể điều chỉnh mức độ chuyển động của chủ thể và máy quay giữa hai mức “low motion” và “high motion”.
Mặc dù mặc định mỗi video chỉ dài 5 giây nhưng Midjourney cho phép người dùng gia hạn thêm 4 giây mỗi lần và tối đa 4 lần, nghĩa là một video có thể dài tới 21 giây.
Cũng giống như các mô hình tạo hình ảnh trước đây, những video do V1 tạo ra mang phong cách siêu thực, khác biệt với thế giới thật, thay vì hướng đến độ chân thực tối đa. Phản hồi ban đầu của cộng đồng về V1 khá tích cực, tuy nhiên vẫn chưa rõ liệu nó có thể cạnh tranh với những mô hình video AI khác vốn đã có mặt trên thị trường từ trước hay không.
Ngày 06/07, điều khoản “lệnh tạm hoãn AI” chính thức bị “khai tử” khỏi dự luật Big Beautiful Bill, với số phiếu áp đảo 99-1 từ thượng viện Mỹ. Điều này đã chấm dứt nỗ lực hạn chế quyền lập pháp của các tiểu bang về AI - một động thái từng khiến chính giới và Thung lũng Silicon chia rẽ sâu sắc.