Vòng tròn để tìm kiếm có thể là shazam chúng tôi cần cho phim

Shazam là một công cụ được sử dụng rộng rãi để xác định các bài hát. Audiophiles trên điện thoại của họ được hưởng lợi từ nhận dạng bài hát tức thì của nó, nhưng phim không có tương đương. Nếu bạn thấy một cảnh trong phòng chờ hoặc trực tuyến, bạn sẽ cần tìm kiếm các chi tiết chính, kiểm tra nhận xét hoặc hy vọng người khác biết điều đó.

Không có nhiều khoảnh khắc khi bạn cần một ứng dụng nhận dạng phim. Một người chuyên dụng có thể ngồi không sử dụng hầu hết thời gian. Chúng tôi có Circle để tìm kiếm, có thể tích hợp nhận dạng video sâu hơn khi bạn cần. Đó là một thay đổi nhỏ có thể tạo ra sự khác biệt lớn, và đây là lý do tại sao nó sẽ xảy ra.

Google đã bỏ lỡ cơ hội để làm một công cụ tìm phim

Để tìm thấy chương trình đó với anh chàng từ chương trình khác

Vòng tròn để tìm kiếm là một công cụ mạnh mẽ để phát hiện các đối tượng, văn bản và một số người trong hình ảnh và video. Nó cho phép bạn làm nổi bật các mục trên màn hình của bạn và nhận kết quả tìm kiếm có liên quan. Nó hoạt động tốt để xác định sản phẩm, địa danh hoặc người nổi tiếng. Nó hoạt động theo cùng một cách cho các bộ phim, đó là ấn tượng. Nhưng, thay vì cho bạn biết cảnh phim đến từ đâu, nó tập trung vào các chi tiết ở trong cảnh.

Nếu bạn kiểm tra nó trên các hình ảnh chuyển động, bạn có thể sẽ nhận được kết quả liên quan đến ví của nhà thiết kế mà một nữ diễn viên đang mang thay vì tên của bộ phim hoặc nhân vật và vai trò của họ. Đó là một cơ hội bị bỏ lỡ để biến tính năng thành một định danh phim, xem xét rằng công nghệ có thể quét các mặt và đối tượng.

Google có cơ sở dữ liệu rộng rãi về phim ảnh, diễn viên và siêu dữ liệu từ IMDB và Wikipedia, trong số các nguồn khác. Nó sẽ không phải là một bước nhảy vọt cho vòng tròn để tìm kiếm để phân tích các yếu tố trực quan và tham chiếu chéo chúng với các clip đã biết.

Bởi vì phim không thể ngồi vẫn đủ lâu để được lấy dấu vân tay

Các máy dễ dàng hơn để xác định âm nhạc vì các bài hát có dấu vân tay âm thanh độc đáo. Một đoạn ngắn của một bản nhạc có các âm, nhịp điệu và hòa âm cụ thể có thể được khớp với cơ sở dữ liệu lớn. Nếu bạn chơi Rhapsody Bohemian mang tính biểu tượng của Nữ hoàng, ứng dụng Shazam đoán nó trong vài giây nếu bạn có kết nối internet mạnh mẽ.

Thành phần được xếp lớp với các hòa âm giọng hát, các phần hoạt động và sự thay đổi mạnh mẽ trong cao độ và nhịp độ. Đừng quên Solo, giai điệu và phrasing đáng kinh ngạc của Brian May. Về mặt kỹ thuật, ứng dụng không nghe thấy các yếu tố này. Thay vào đó, nó phân tích tính nhất quán của chúng trên các bản ghi khác nhau để xác định chính xác bản nhạc. Vì vậy, nó ít quan trọng hơn nếu nó chơi trên vinyl, spotify hoặc quảng cáo.

Mặt khác, phim phức tạp hơn. Một bộ phim duy nhất mang vô số khung hình với ánh sáng khác nhau, góc camera và các lớp màu thay đổi từ cảnh này sang cảnh khác. Ngay cả trong một bộ phim, cùng một cảnh có thể được quay trong nhiều phiên bản hoặc được chỉnh sửa cho các vùng khác nhau.

Ngoài ra còn có vấn đề về cách các studio sản xuất, nền tảng phát trực tuyến và nhà phân phối nắm giữ quyền. Không có một nguồn toàn diện cho siêu dữ liệu phim. Không có gì đáng ngạc nhiên khi hầu hết các ứng dụng sẽ bị bối rối. Mặc dù thách thức, nhưng nó không phải là không thể.

Có liên quan

Những bộ phim mới hay nhất bạn có thể xem ở nhà ngay bây giờ

Có rất nhiều thứ để xem ở nhà những ngày này, và chúng tôi đang làm tròn những bộ phim hay nhất (và tồi tệ nhất) mà bạn có thể phát trực tuyến

Google không phải bắt đầu từ đầu

Những gì Thetake và Amazon có thể dạy họ

Thetake chứng minh rằng nhận dạng phim không chỉ thực tế. Nó đã được thực hiện. Ứng dụng lấy cảm hứng từ Shazam được nhắm mục tiêu vào những người mua sắm muốn tạo lại thời trang trên màn hình. Nó cũng có thể quan sát các nội dung khác nhau mà bạn cung cấp để tìm một kết hợp phim chính xác bằng cách sử dụng trí tuệ nhân tạo, phát hiện âm thanh, học sâu và nhận dạng nội dung tự động (ACR).

Giao diện lập trình ứng dụng có thể tích hợp (API) cũng là một lợi ích cho các nền tảng quan tâm đến việc thêm hệ thống của ứng dụng vào các giải pháp hiện có. Điều đáng chú ý là tất cả các dịch vụ này đã có sẵn trong năm 2014. Nếu Thetake có thể làm điều này trong một thập kỷ trước với AI hạn chế, Google có thể tích hợp chức năng tương tự vào Circle để tìm kiếm và Google Lens. Các công cụ AI của công ty là tuyệt vời trong nhận dạng hình ảnh và đối tượng. Phần còn thiếu là lập chỉ mục dựa trên cảnh.

Amazon Prime Video là một ví dụ khác mà Google có thể học hỏi. Tính năng X-quang của nó được tích hợp vào trải nghiệm phát trực tuyến. Nó cho thấy dàn diễn viên và nhạc phim của một bộ phim và cung cấp những câu đố trong quá trình phát lại.

Trở thành một thám tử phim

Bạn có những lựa chọn thay thế khi bạn muốn biết những gì bạn đang xem. Google Lens là một lựa chọn. Nó chọn trên khuôn mặt, văn bản hoặc các đối tượng trong một cảnh. Mặc dù độ chính xác của nó có thể bị đánh hoặc bỏ lỡ. Một cách tiếp cận dựa trên cộng đồng đang chuyển sang Subreddits. r/tipofmytongue và r/namethatmovie là sở thích của tôi. Những diễn đàn này chứa đầy những người đam mê phim, những người thích thử thách tìm phim. Nó cũng giúp nếu bạn nhớ một trích dẫn trực tiếp từ bộ phim. Một dòng đáng nhớ có thể là một manh mối mạnh mẽ.


Khám phá thêm từ Phụ Kiện Đỉnh

Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.

Gửi phản hồi

Khám phá thêm từ Phụ Kiện Đỉnh

Đăng ký ngay để tiếp tục đọc và truy cập kho lưu trữ đầy đủ.

Tiếp tục đọc