Pengenalan ucapan AI dan pemrosesan video: Bagaimana cara menambahkan subtitle yang akurat ke video?
Di era media digital, video menjadi salah satu sarana penyebaran informasi yang penting. Namun, bagi para tunarungu atau mereka yang ingin menonton video di lingkungan sepi, subtitle sudah menjadi sebuah kebutuhan. Subtitle yang akurat dan tepat waktu tidak hanya meningkatkan aksesibilitas video Anda tetapi juga meningkatkan pengalaman pemirsa. Jadi, bagaimana cara menambahkan subtitle yang akurat ke video? Dengan bantuan teknologi pengenalan suara AI, proses ini menjadi lebih mudah dan sederhana.
Prinsip dasar pengenalan suara AI
Pengenalan ucapan AI adalah teknologi yang mengubah bahasa manusia menjadi teks melalui algoritma komputer. Ini bergantung pada model pembelajaran mendalam dan dilatih pada sejumlah besar data ucapan untuk beradaptasi dengan aksen, kecepatan bicara, dan kebisingan latar belakang yang berbeda. Ada banyak alat pengenalan suara yang sangat baik di pasaran, seperti API Ucapan-ke-Teks Google. Alat-alat ini memberikan fungsionalitas ucapan-ke-teks yang kuat, menjadikan produksi subtitle lebih efisien dan akurat.
Buat subtitle menggunakan Google Speech-to-Text API
Langkah 1: Buat proyek Google Cloud dan aktifkan API
Pertama, Anda harus memiliki akun Google dan mengunjungi situs resmi Google Cloud Platform (GCP) (https://cloud.google.com/) untuk membuat proyek baru. Di proyek Anda, navigasikan ke halaman "API & Layanan", cari dan aktifkan "Cloud Speech-to-Text API".
Langkah 2: Siapkan file video
Unggah file video yang perlu diberi subtitle ke ruang penyimpanan cloud, seperti Google Cloud Storage. Pastikan format file video adalah format audio umum seperti MP4 atau MOV.
Langkah 3: Panggil API untuk mengubah ucapan menjadi teks
Selanjutnya, gunakan Google Cloud SDK atau pustaka klien dalam bahasa pemrograman Anda untuk memanggil API Speech-to-Text. Anda dapat menulis skrip sederhana yang membaca bagian audio dari file video dan kemudian mengirimkan permintaan ke API. Misalnya, dengan Python, Anda dapat menggunakan cuplikan kode berikut:
`piton
dari google.cloud impor pidato_v1p1beta1 sebagai ucapan
impor os
os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "jalur/ke/kredensial/anda.json"
klien = ucapan.SpeechClient()
dengan open("audio_file_path", "rb") sebagai audio_file:
konten = audio_file.baca()
audio = ucapan.RecognitionAudio(konten=konten)
config = ucapan.RecognitionConfig(
pengkodean=ucapan.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=44100,
bahasa_kode="en-AS",
)
respon = klien.kenali(config=config, audio=audio)
untuk hasil di respon.hasil:
print("Transkrip: {}".format(hasil.alternatif[0].transkrip))
`
Kode ini menunjukkan cara mendapatkan teks ucapan dari file audio.
Langkah 4: Integrasikan file subtitle
Setelah mendapatkan konten teks, dapat diubah menjadi file subtitle dalam SRT atau format lainnya. Kemudian, gunakan perangkat lunak pengeditan video, seperti Adobe Premiere Pro atau Final Cut Pro, untuk mengimpor file subtitle yang dihasilkan ke dalam video. Ini akan menampilkan subtitle secara bersamaan dengan pemutaran video.
Kesimpulan
Dengan menggunakan teknologi pengenalan suara AI, kami tidak hanya dapat dengan mudah menambahkan subtitle yang akurat ke video, namun juga meningkatkan efisiensi kerja secara signifikan. Baik untuk memenuhi kebutuhan aksesibilitas atau untuk meningkatkan tampilan dan nuansa video Anda, menguasai keterampilan ini sangatlah penting. Semoga panduan yang diberikan dalam artikel ini dapat membantu Anda lebih memahami dan menerapkan teknologi ini.