Các công cụ video AI sáng tạo đã đạt đến mức bạn có thể tạo video dài 5 giây gần như không thể phân biệt được với một clip do con người quay. Tuy nhiên, tính nhất quán vẫn là một vấn đề nếu bạn muốn tạo một bộ phim ngắn, video thương mại hoặc video ca nhạc vì các nhân vật không được đưa vào giữa các clip.
Bạn có thể thực hiện việc này nhưng trước tiên bạn cần sử dụng hình ảnh và đảm bảo tính nhất quán trên mọi hình ảnh bạn sử dụng trong lời nhắc video. Nền tảng đầu tiên giải quyết vấn đề này là LTX Studio của Lightricks nhưng nó chỉ giới hạn ở các mô hình trong nền tảng này. reelMagic từ Higgsfield thay đổi điều đó.
ReelMagic tập hợp các quy trình làm việc nội dung AI tốt nhất vào một nền tảng, tạo tập lệnh từ lời nhắc của bạn, tạo hình ảnh với các ký tự tùy chỉnh cho mỗi cảnh quay, sau đó cho phép bạn biến những hình ảnh đó thành video và tùy chỉnh câu chuyện trong chế độ xem dòng thời gian.
Bạn có thể tạo một bộ phim ngắn dài tối đa 10 phút và có thể chọn giữa Recraft, Keyframe, Flux và Higgsfield Frame cho hình ảnh và Runway Kling và MiniMax để tạo video. Bạn cũng có hiệu ứng âm thanh và giọng nói do ElevenLabs cung cấp và hát nhép cho các diễn viên AI.
Đưa reelMagic vào thử nghiệm
ReelMagic: Hướng dẫn sử dụng – YouTube
Xem tiếp
reelMagic hoạt động dựa trên thực tế là mọi mô hình video hoặc hình ảnh AI đều cung cấp những điều khác biệt. Một số có khả năng nắm bắt cảm xúc tốt hơn, số khác lại có khả năng siêu thực. Khi tạo một dự án video AI theo cách thủ công, tôi thường phải sử dụng kết hợp nhiều mô hình để đạt được hiệu quả mong muốn.
Để tạo một video dài 3 phút bằng AI, bạn có thể mất khoảng thời gian tốt nhất trong tuần nếu bạn viết kịch bản, lập kế hoạch quay và tạo từng hình ảnh (hãy nhớ rằng bạn thường phải chạy lời nhắc nhiều lần để có được hình ảnh chính xác mà bạn nghĩ đến) và sau đó tạo video clip từ mỗi hình ảnh (một lần nữa, chạy nó nhiều lần do có bất kỳ lỗi nào).
Sau đó, bạn cần chuyển sang thiết kế âm thanh sau khi đã có video, tạo hiệu ứng âm thanh, bầu không khí, âm nhạc và thuyết minh. Một số cảnh quay cũng sẽ yêu cầu hát nhép. Sau khi xem lại tôi thường thấy thiếu một cảnh quay nên sẽ phải quay lại và lặp lại quá trình này.
ReelMagic thực hiện tất cả những điều đó chỉ trong một lần nhắc nhở. Bạn sẽ nhận được một tập lệnh mà bạn có thể chỉnh sửa, một danh sách các hình ảnh mà bạn có thể tạo lại hoặc thay thế, sau đó là cách tạo video cho mỗi lần quay, theo từng mô hình hoặc toàn bộ. Nó tự động thêm các hiệu ứng âm thanh mà bạn cũng có thể điều chỉnh theo nhu cầu của riêng mình.
Higgsfield, người tạo ra reelMagic, đã viết rằng nó “cho phép người sáng tạo chỉnh sửa các yếu tố cụ thể mà không ảnh hưởng đến giao diện của câu chuyện tổng thể của họ”. Tính năng yêu thích của tôi là có thể xác định và thiết kế các ký tự một lần và thay đổi chúng trong suốt dự án.
Tạo một câu chuyện với reelMagic
Đây là video cuối cùng được tạo ra thông qua quá trình được nêu dưới đây. Tổng thời gian từ lời nhắc ban đầu đến khi xuất video là khoảng 35 phút.
Tôi đã đưa ra lời nhắc này cho reelMagic:
“Đêm là lúc chúng xuất hiện, những sinh vật bóng tối sinh ra từ lòng căm thù của chúng ta. Những cơn ác mộng ám ảnh những giấc mơ của chúng ta và thì thầm những lời hủy diệt và tuyệt vọng vào tai những kẻ quyền lực. Không ai biết họ đến từ đâu, chưa ai từng nhìn thấy họ, nhưng họ luôn ở đó và luôn ở đó kể từ buổi bình minh của nền văn minh nhân loại. Một số người nói rằng họ là loài đầu tiên trên Trái đất – những linh hồn mang theo những cơn gió sao từ một thế giới đã chết từ lâu. Những người khác nói rằng đó là những tưởng tượng của tổ tiên chúng ta mà không thể buông bỏ được. Tất cả những gì chúng tôi biết là… họ đang ngày càng mạnh hơn.”
Sau đó tôi phải chọn một “phong cách”. Điều này có thể được lấy cảm hứng từ một chương trình hiện có, chẳng hạn như Thứ Tư hoặc một ý tưởng tùy chỉnh. Tôi chọn bản gốc vì tôi muốn xem AI đã nghĩ ra điều gì.
Sau khoảng ba phút, tôi được xem kịch bản, dàn nhân vật và danh sách địa điểm mà tôi có thể điều chỉnh, thiết kế lại, gán giọng nói hoặc thay đổi cho phù hợp với ý tưởng của mình.
Khi tôi thực hiện việc này để kiểm tra nền tảng, tôi đã thực hiện tất cả các cài đặt được cung cấp, bao gồm cả kịch bản. Tôi không thay đổi bất cứ điều gì vì tôi muốn xem AI tự mình nghĩ ra điều gì. Ý tưởng là để xem nó có thể tạo ra một dự án đầy đủ từ một lời nhắc duy nhất tốt đến mức nào.
https://cdn.mos.cms.futurecdn.net/KSDZKQBLFxYK4srM546SQb-480-80.png 480w, https://cdn.mos.cms.futurecdn.net/KSDZKQBLFxYK4srM546SQb-650-80.png 650w, https://cdn.mos.cms.futurecdn.net/KSDZKQBLFxYK4srM546SQb-970-80.png 970w, https://cdn.mos.cms.futurecdn.net/KSDZKQBLFxYK4srM546SQb-1024-80.png 1024w, https://cdn.mos.cms.futurecdn.net/KSDZKQBLFxYK4srM546SQb-1200-80.png 1200w" sizes="(min-width: 1000px) 970px, calc(100vw - 40px)" loading="lazy" data-original-mos="https://cdn.mos.cms.futurecdn.net/KSDZKQBLFxYK4srM546SQb.png" data-pin-media="https://cdn.mos.cms.futurecdn.net/KSDZKQBLFxYK4srM546SQb.png"/>
Chế độ xem bảng phân cảnh cho phép bạn xem lại tất cả các cảnh quay đã tạo và thực hiện bất kỳ thay đổi thích hợp nào. Điều này bao gồm việc tạo lại một cảnh quay bằng một mẫu hình ảnh khác, hoán đổi khuôn mặt nếu nó không phù hợp với tầm nhìn của bạn và tạo video.
Sau đó, bạn có thể vào chế độ xem Trình chỉnh sửa. Đây giống như một nền tảng chỉnh sửa video điển hình trong đó các clip riêng lẻ được đặt lần lượt trên dòng thời gian, hoàn chỉnh với hiệu ứng âm thanh và lời nói. Sau khi tạo video, bạn cũng có thể đồng bộ hóa từng khuôn mặt với giọng nói được tạo.
Tôi quyết định tạo nó bằng cách sử dụng cùng một mô hình cho tất cả các clip – Kling 1.5 Pro – vì đây là một công cụ toàn diện tốt. Nó cũng là mẫu chậm nhất trong số tất cả các mẫu được cung cấp, vì vậy bài viết này mất nhiều thời gian hơn tôi mong đợi một chút.
Nó diễn ra như thế nào
Bạn có thể xem kết quả cuối cùng ở trên trong video YouTube, hoàn chỉnh với lồng tiếng, hát nhép và hiệu ứng âm thanh. Tôi cũng đã làm một ví dụ ngắn 30 giây về cách tôi có thể xử lý cảnh mở đầu bằng quy trình làm việc thông thường của mình trong Pika 2.0 (bên dưới).
Xem xét quá trình này phần lớn được tự động hóa, kết quả cuối cùng gần giống với thứ tôi đã tạo thủ công hơn tôi mong đợi.
Tôi sẽ không coi câu chuyện như đã viết vì nó hơi cơ bản một chút và tôi đã thay đổi các nhân vật, thêm sự đa dạng hơn cho các cảnh quay và thêm vào sự tinh tế hơn, nhưng đối với nỗ lực chỉ một cảnh quay – nó không tệ.
Giá trị thực sự nằm ở việc dễ dàng thay đổi bất kỳ yếu tố đơn lẻ nào trong quy trình. Điều này khiến nó trở thành một công cụ sản xuất giống như một cách để tạo video AI có thời lượng dài hơn chỉ từ một lời nhắc. Tôi có thể sử dụng nó để lập kịch bản cho một ý tưởng, nhanh chóng lặp lại các thay đổi và sau đó tạo ở một nơi trên các mô hình khác nhau.
Đây là một ví dụ về nơi mà tôi nghĩ thế hệ công cụ AI tiếp theo sẽ hướng tới – sản xuất. Các mô hình đang được cải thiện với tốc độ nhanh chóng, vì vậy bước hợp lý tiếp theo là tạo ra các công cụ hỗ trợ AI mà bạn có thể sử dụng để tạo dự án chứ không phải chỉ dùng một clip duy nhất.
Thông tin khác từ Hướng dẫn của Tom
Khám phá thêm từ Phụ Kiện Đỉnh
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.