অনলাইন ডেস্ক
ভিডিও দেখার সময় স্বয়ংক্রিয়ভাবে সাবটাইটেল তৈরির জন্য কৃত্রিম বুদ্ধিমত্তা বা এআই প্রযুক্তি ব্যবহার করছে জনপ্রিয় মিডিয়া প্লেয়ার অ্যাপ ভিএলসি। এই ফিচারের মাধ্যমে একাধিক ভাষায় সাবটাইটেল তৈরি করে দেবে অ্যাপটি। ফলে ভিডিওতে সাবটাইটেল না থাকলেও আর কোনো সমস্যা হবে না।
গত ৭ জানুয়ারি থেকে শুরু হওয়া প্রযুক্তির মহাসম্মেলন কনজ্যুমার ইলেকট্রনিকস শোতে (সিইএস) ফিচারটি প্রকাশ্যে আনে অ্যাপটির মূল কোম্পানি ভিডিওল্যান। নতুন ফিচারটি বোঝানোর জন্য একটি ভিডিও উদাহরণ হিসেবে প্রদর্শন করেন কোম্পানিটির প্রেসিডেন্ট জিন-ব্যাপ্টিস্ট কেম্প।
ওপেন সোর্স এআই মডেল ব্যবহার করে চলমান ভিডিওর জন্য সাবটাইটেল তৈরি করবে ফিচারটি। ভিডিওতে কী বলা হচ্ছে, তা ট্রান্সক্রাইব করতে এবং তারপর সেটি নির্বাচিত ভাষায় অনুবাদ করতে এআই মডেলটি ব্যবহার করা হবে।
এটি ব্যবহারকারীদের পিসিতে স্থানীয়ভাবে সাবটাইটেল তৈরি করবে। ফলে কোনো তৃতীয় পক্ষের সার্ভারের ওপর নির্ভর করতে হবে না এবং অফলাইনে সাবটাইটেল দেখতে পারবেন ব্যবহারকারীরা। এই ফিচার শতাধিক ভাষা সমর্থন করবে।
ভিডিওতে পূর্বে সাবটাইটেল যুক্ত করা না থাকলে ভিডিও দেখার সময় তাদের প্রয়োজনীয় সাবটাইটেলগুলো আলাদা করে ‘. srt’ ফাইল আকারে ডাউনলোড করতে হয় ব্যবহারকারীদের। তবে এই সমস্যা সমাধানে ভিএলসি এআই মডেলগুলোর সাহায্য নিচ্ছে।
ভিএলসির চিফ মার্কেটিং অফিসার নাটাচা হোল্টজহাউসার বলেন, ‘এই উদ্ভাবন শুধু সাবটাইটেল সম্পর্কিত নয়; এটি অন্তর্ভুক্তির বিষয় এবং বিশ্বব্যাপী কনটেন্ট গ্রহণের অভিজ্ঞতা সমৃদ্ধ করার বিষয়ে একটি গুরুত্বপূর্ণ পদক্ষেপ।
হোল্টজহাউসার আরও জানান, ভিএলসির একটি ব্লগ পোস্টে এই প্রযুক্তি নিয়ে আরও বিস্তারিত জানানো হবে।
ভিএলসি এই প্রযুক্তি ব্যবহারের জন্য ওপেনএআইয়ের হুইসপার প্রযুক্তি ব্যবহার করতে পারে। এটি একটি ওপেন সোর্স স্পিচ রিকগনিশন টুল। তবে এআই মডেলগুলো কীভাবে প্রশিক্ষণ দেওয়া হয়েছে, তা নিয়ে সন্দেহ প্রকাশ করেছেন প্রযুক্তি বিশ্লেষকেরা। এ ছাড়া এআই দিয়ে তৈরি সাবটাইটেল মাঝে মাঝে ভুল বা বিভ্রান্তিকরণ তথ্য দিতে পারে, যা মানুষের তৈরি সাবটাইটেলের তুলনায় খারাপ অভিজ্ঞতা সৃষ্টি করতে পারে।
এ সপ্তাহে ৬ বিলিয়ন ডাউনলোডের মাইলফলক উদ্যাপন করেছে ভিডিওল্যান। বিষয়টি নিয়ে গর্ব করে কোম্পানিটির প্রেসিডেন্ট জিন ব্যাপটিস্ট কেম্প বলেন, স্ট্রিমিং সার্ভিসের এই যুগেও ভিএলসির সক্রিয় ব্যবহারকারীর সংখ্যা বাড়ছে।
তবে সাবটাইটেলের এআই ফিচার অ্যাপে আনুষ্ঠানিকভাবে কবে পাওয়া যাবে, তা জানায়নি কোম্পানিটি।
ভিএলসি মিডিয়া প্লেয়ার একটি ওপেন-সোর্স সফটওয়্যার, যা ভিডিও ও অডিও প্লেব্যাকের জন্য ব্যবহৃত হয়। এটি উইন্ডোজ, ম্যাকওএস, লিনাক্স, অ্যান্ড্রয়েড ও আইওএসের মতো একাধিক প্ল্যাটফর্মে চালানো যায়। যেমন: ২০০১ সালে প্রথম প্রকাশিত হয় ভিএলসি। এরপর এটি বিশ্বের অন্যতম জনপ্রিয় মিডিয়া প্লেয়ার হয়ে ওঠে।
তথ্যসূত্র: পিসি ম্যাগ ও দ্য ভার্জ
ভিডিও দেখার সময় স্বয়ংক্রিয়ভাবে সাবটাইটেল তৈরির জন্য কৃত্রিম বুদ্ধিমত্তা বা এআই প্রযুক্তি ব্যবহার করছে জনপ্রিয় মিডিয়া প্লেয়ার অ্যাপ ভিএলসি। এই ফিচারের মাধ্যমে একাধিক ভাষায় সাবটাইটেল তৈরি করে দেবে অ্যাপটি। ফলে ভিডিওতে সাবটাইটেল না থাকলেও আর কোনো সমস্যা হবে না।
গত ৭ জানুয়ারি থেকে শুরু হওয়া প্রযুক্তির মহাসম্মেলন কনজ্যুমার ইলেকট্রনিকস শোতে (সিইএস) ফিচারটি প্রকাশ্যে আনে অ্যাপটির মূল কোম্পানি ভিডিওল্যান। নতুন ফিচারটি বোঝানোর জন্য একটি ভিডিও উদাহরণ হিসেবে প্রদর্শন করেন কোম্পানিটির প্রেসিডেন্ট জিন-ব্যাপ্টিস্ট কেম্প।
ওপেন সোর্স এআই মডেল ব্যবহার করে চলমান ভিডিওর জন্য সাবটাইটেল তৈরি করবে ফিচারটি। ভিডিওতে কী বলা হচ্ছে, তা ট্রান্সক্রাইব করতে এবং তারপর সেটি নির্বাচিত ভাষায় অনুবাদ করতে এআই মডেলটি ব্যবহার করা হবে।
এটি ব্যবহারকারীদের পিসিতে স্থানীয়ভাবে সাবটাইটেল তৈরি করবে। ফলে কোনো তৃতীয় পক্ষের সার্ভারের ওপর নির্ভর করতে হবে না এবং অফলাইনে সাবটাইটেল দেখতে পারবেন ব্যবহারকারীরা। এই ফিচার শতাধিক ভাষা সমর্থন করবে।
ভিডিওতে পূর্বে সাবটাইটেল যুক্ত করা না থাকলে ভিডিও দেখার সময় তাদের প্রয়োজনীয় সাবটাইটেলগুলো আলাদা করে ‘. srt’ ফাইল আকারে ডাউনলোড করতে হয় ব্যবহারকারীদের। তবে এই সমস্যা সমাধানে ভিএলসি এআই মডেলগুলোর সাহায্য নিচ্ছে।
ভিএলসির চিফ মার্কেটিং অফিসার নাটাচা হোল্টজহাউসার বলেন, ‘এই উদ্ভাবন শুধু সাবটাইটেল সম্পর্কিত নয়; এটি অন্তর্ভুক্তির বিষয় এবং বিশ্বব্যাপী কনটেন্ট গ্রহণের অভিজ্ঞতা সমৃদ্ধ করার বিষয়ে একটি গুরুত্বপূর্ণ পদক্ষেপ।
হোল্টজহাউসার আরও জানান, ভিএলসির একটি ব্লগ পোস্টে এই প্রযুক্তি নিয়ে আরও বিস্তারিত জানানো হবে।
ভিএলসি এই প্রযুক্তি ব্যবহারের জন্য ওপেনএআইয়ের হুইসপার প্রযুক্তি ব্যবহার করতে পারে। এটি একটি ওপেন সোর্স স্পিচ রিকগনিশন টুল। তবে এআই মডেলগুলো কীভাবে প্রশিক্ষণ দেওয়া হয়েছে, তা নিয়ে সন্দেহ প্রকাশ করেছেন প্রযুক্তি বিশ্লেষকেরা। এ ছাড়া এআই দিয়ে তৈরি সাবটাইটেল মাঝে মাঝে ভুল বা বিভ্রান্তিকরণ তথ্য দিতে পারে, যা মানুষের তৈরি সাবটাইটেলের তুলনায় খারাপ অভিজ্ঞতা সৃষ্টি করতে পারে।
এ সপ্তাহে ৬ বিলিয়ন ডাউনলোডের মাইলফলক উদ্যাপন করেছে ভিডিওল্যান। বিষয়টি নিয়ে গর্ব করে কোম্পানিটির প্রেসিডেন্ট জিন ব্যাপটিস্ট কেম্প বলেন, স্ট্রিমিং সার্ভিসের এই যুগেও ভিএলসির সক্রিয় ব্যবহারকারীর সংখ্যা বাড়ছে।
তবে সাবটাইটেলের এআই ফিচার অ্যাপে আনুষ্ঠানিকভাবে কবে পাওয়া যাবে, তা জানায়নি কোম্পানিটি।
ভিএলসি মিডিয়া প্লেয়ার একটি ওপেন-সোর্স সফটওয়্যার, যা ভিডিও ও অডিও প্লেব্যাকের জন্য ব্যবহৃত হয়। এটি উইন্ডোজ, ম্যাকওএস, লিনাক্স, অ্যান্ড্রয়েড ও আইওএসের মতো একাধিক প্ল্যাটফর্মে চালানো যায়। যেমন: ২০০১ সালে প্রথম প্রকাশিত হয় ভিএলসি। এরপর এটি বিশ্বের অন্যতম জনপ্রিয় মিডিয়া প্লেয়ার হয়ে ওঠে।
তথ্যসূত্র: পিসি ম্যাগ ও দ্য ভার্জ
যখন ডিপসিকের কৃত্রিম বুদ্ধিমত্তা বা এআই প্রযুক্তি পুরো বিশ্বের নজর কাড়ছে, তখন একটি পুরোনো জাপানি ধারণা আবার আলোচনায় উঠে এসেছে। আর সেটি হলো ‘কাইজেন’। এর অর্থ অবিচ্ছিন্ন উন্নতি। আজকাল কাইজেনের ধারণাটি শুধু জাপান নয়, চীনের জন্যও শক্তিশালী এক কৌশল হিসেবে আত্মপ্রকাশ করেছে। পশ্চিমা বিশ্বের জন্য এটি উদ্বেগ
৬ ঘণ্টা আগেআগামী ৪ মার্চ নতুন পণ্য উন্মোচনের ঘোষণা দিয়েছে লন্ডন ভিত্তিক স্মার্টফোন প্রস্তুতকারক কোম্পানি নাথিং। সেই ইভেন্টে ‘নাথিং ফোন ৩ এ’ এবং ‘ফোন ৩এ প্রো’ উন্মোচন করা হতে পারে বলে গুঞ্জন রয়েছে। আনুষ্ঠানিকভাবে ফোন দুটি সম্পর্কে কোনো তথ্য না দিলেও কোম্পানিটির সম্ভাব্য মডেলের ছবি অনলাইনে ফাঁস হয়ে গেছে। এই ছবি
১০ ঘণ্টা আগেচীনের ডিপসিকের কৃত্রিম বুদ্ধিমত্তা (এআই) মডেলগুলো নিয়ে নিজের মতামত প্রকাশ করেছেন অ্যাপলের সিইও টিম কুক। তাঁর মতে, মডেলটি ‘দক্ষতা বৃদ্ধির উদ্ভাবন’ হিসেবে কাজ করবে। গতকাল বৃহস্পতিবার আর্থিক প্রতিবেদন প্রকাশ করার সময় কুক এই মন্তব্য করে।
১২ ঘণ্টা আগেযুক্তরাষ্ট্রের অন্যতম শীর্ষ কৃত্রিম বুদ্ধিমত্তা গবেষণা প্রতিষ্ঠান ওপেনএআইয়ে ৪০ বিলিয়ন ডলার বিনিয়োগের জন্য আলোচনা করছে জাপানের অন্যতম শীর্ষ বাণিজ্যিক প্রতিষ্ঠান সফটব্যাংক। নতুন বিনিয়োগের ফলে ওপেনএআই–এর মোট বাজারমূল্য ৩০০ বিলয়ন ডলার হবে। এই আলোচনা সফল হলে, এটি একক ফান্ডিং রাউন্ডে সর্বোচ্চ পরিমাণ অর্থ
১৩ ঘণ্টা আগে