অনলাইন ডেস্ক
বিশ্বের সবচেয়ে বড় অনলাইন বিশ্বকোষ উইকিপিডিয়ার ইংরেজি সংস্করণে আর্টিকেল বা নিবন্ধের সংখ্যা ৭০ লাখের কাছাকাছি। তবে দ্বিতীয় বৃহত্তম সংস্করণটি ফরাসি, স্প্যানিশ বা চীনা ভাষায় নয়—এটি ফিলিপাইনের দক্ষিণাঞ্চলে প্রচলিত স্থানীয় ভাষা সেবুয়ানোয় লেখা হয়েছে। এই সংস্করণের নিবন্ধ সংখ্যা ৬০ লাখেরও বেশি। আর অবাক করা বিষয় হলো সেবুয়ানো উইকিপিডিয়ার অধিকাংশ নিবন্ধ লিখেছেন একজন ব্যক্তি—সুইডিশ ভাষাবিদ সভারকার ইয়োহানসন। তবে হাতে নয়, এক স্বয়ংক্রিয় প্রোগ্রামের মাধ্যমে। এই প্রোগ্রামের নাম এলএসজেবট।
যেভাবে কাজ করে এলএসজেবট
উইকিপিডিয়ায় নানা ধরনের কাজ সহজ করতে বহু বছর ধরেই বট বা স্বয়ংক্রিয় প্রোগ্রাম ব্যবহার হয়ে আসছে। এরা সাধারণত সাইট ঘুরে ডেড লিংক ঠিক করা বা সংক্ষিপ্ত নিবন্ধ তৈরি করার মতো কাজ করে।
২০১০ দশকের শুরুতে, উইকিপিডিয়ায় লিখতেন সভারকার ইয়োহানসন। তখনই তিনি এই স্বয়ংক্রিয় নিবন্ধ-লেখক বটগুলোর সঙ্গে পরিচিত হন।
এরপর তিনি তৈরি করেন এলএসজেবট নামের বিশেষ প্রোগ্রাম। এটি বিভিন্ন অনলাইন ডেটাবেস থেকে তথ্য সংগ্রহ করে নির্দিষ্ট কিছু বাক্য কাঠামোতে বসিয়ে নিবন্ধ তৈরি করে।
উদাহরণস্বরূপ, কোনো প্রাণীর ওপর একটি নিবন্ধের শুরুতে লেখা থাকতে পারে—‘দ্য এক্স ইজ অ্যা ওয়াই বিলংগস টু দ্য জেড ফ্যামিলি’। এখানে এক্স, ওয়াই এবং জেড জায়গাগুলো ফাঁকা থাকে। এখানে এক্স=লাইওন (সিংহ), ওয়াই=ম্যামল (স্তন্যপায়ী), জেড=ক্যাট (বিড়াল)। তাহলে সম্পূর্ণ বাক্যটি দাঁড়ায়–‘দ্য লাইয়ন ইজ অ্যা ম্যামল দ্যাট বিলংগস টু দ্য জেড ক্যাট ফ্যামিলি।’ এভাবে তৈরি হয় লাখ লাখ নিবন্ধ।
ঠিক এইভাবে, এলএসজবট নামের প্রোগ্রামটি একটি নির্দিষ্ট ফরম্যাটে বা টেমপ্লেটে তথ্য বসিয়ে অসংখ্য নিবন্ধ তৈরি করত। এটি মূলত ডেটাবেইস থেকে তথ্য নিয়ে বানানো নির্দিষ্ট বাক্যের ছাঁচে ফেলে লেখা তৈরি করত—কোনো নতুন কথা বা ব্যাখ্যা তৈরি করত না।
বটটি মূলত জীববিজ্ঞান ও ভূগোলভিত্তিক তথ্য ব্যবহার করে উদ্ভিদ ও প্রাণীদের নিয়ে এখন পর্যন্ত প্রায় ২০ লাখ নিবন্ধ এবং ভৌগোলিক স্থান নিয়ে ৪০ লাখ বিভিন্ন নিবন্ধ তৈরি করেছে।
সেবুয়ানো ভাষায় কাজ করার পেছনে ইয়োহানসনের ব্যাখ্যা ছিল ব্যক্তিগত। তাঁর স্ত্রীর মাতৃভাষা সেবুয়ানো। তিনিই বাক্য কাঠামো তৈরিতে সাহায্য করেন।
এলএসজেবট নিয়ে বিতর্ক
সেবুয়ানো উইকিপিডিয়ায় এলএসজেবট ব্যবহার নিয়ে তীব্র বিতর্ক তৈরি হয়। বটের তৈরি অসংখ্য নিবন্ধে ব্যাকরণগত ভুল ও তথ্যগত ত্রুটি পাওয়া যায়। অনুবাদগুলো ছিল অসম্পূর্ণ বা ভুল হওয়ার কারণে এই সমস্যা তৈরি হয়।
অতিরিক্ত সংখ্যক নিবন্ধ তৈরি করাও এই সমস্যার কারণ হয়। এ ছাড়া সম্পাদক স্বল্পতার কারণে এই বিশাল তথ্যভান্ডার ত্রুটিমুক্ত করাও কঠিন হয়ে পড়ে।
এমনকি পুরো সেবুয়ানো উইকিপিডিয়া মুছে ফেলার প্রস্তাবও আসে ২০১৮ সালে, যা পরে বাতিল করা হয়।
ফিলিপাইনের আরেক উইকিপিডিয়ান ইরভিন স্টো. তোমাস জানান, কিছু স্থানীয় স্বেচ্ছাসেবক এখনো চেষ্টা চালিয়ে যাচ্ছেন গুণগত মান উন্নয়নে এবং ড. ইয়োহানসনের সঙ্গেও কাজ করেছেন।
এদিকে উইকিপিডিয়ার লেখক জোশ লিম বলেন—বট ব্যবহারের কারণে আগে থেকেই বিশ্বাসযোগ্যতার সমস্যা তৈরি হয়েছে। সেবুয়ানো উইকিপিডিয়ার প্রাথমিক পর্যায়ে বহু ফরাসি গ্রাম নিয়ে নিবন্ধ ছিল, অথচ স্থানীয় বিষয় ছিল অপ্রতুল। এটি একটি ‘লজ্জাজনক’ বিষয় হয়ে দাঁড়ায়। বটের কারণে ভাষাভিত্তিক উইকিপিডিয়াগুলোর মধ্যে ‘পরিমাণের প্রতিযোগিতা’ শুরু হয়, যাতে গুণমান উপেক্ষিত হয়।
লিম আরও বলেন, সমালোচনা থাকলেও ইয়োহানসনের উদ্দেশ্য ছিল নিষ্ঠার সঙ্গে জ্ঞানের প্রসার ঘটানো। তিনি বলেন, বট বা স্বয়ংক্রিয় প্রযুক্তিকে পুরোপুরি বাদ দেওয়া ঠিক নয় বরং সঠিকভাবে ব্যবহার করতে শিখতে হবে।
২০২১ সাল থেকে এলএসজেবট নিষ্ক্রিয় এবং বিতর্কই এর পেছনে অন্যতম কারণ বলে জানান ইয়োহানসন নিজেই।
উইকিপিডিয়ায় স্থানীয় ভাষার অবমূল্যায়ন ও জেনারেটিভ এআইয়ের চ্যালেঞ্জ
ড. ইয়োহানসনের তৈরি এলএসজেবট বন্ধ হয়ে যায়, কারণ এটি সেবুয়ানো উইকিপিডিয়ায় বেশি পাঠক তৈরি করতে পারেনি। সাইটে লাখো নিবন্ধ থাকলেও, পাঠক ছিল হাজার হাজার। অন্যদিকে, ইংরেজি উইকিপিডিয়া প্রতি মাসে ১০ কোটির বেশি ফিলিপাইনের পাঠক পায়।
উইকিপিডিয়ান জোশ লিম বলেন, এটা ফিলিপাইনের সমাজে ঔপনিবেশিক মানসিকতার প্রতিফলন, যেখানে মাতৃভাষাকে অবমূল্যায়ন করা হয়। এর ফলে স্থানীয় ভাষায় তথ্যের ঘাটতি তৈরি হয়। তবে তিনি মনে করেন, বর্তমানে নিজস্ব ভাষা নিয়ে মানুষের মধ্যে নতুন করে আগ্রহ ও সচেতনতা তৈরি হচ্ছে এবং উইকিপিডিয়া এতে বড় ভূমিকা রাখতে পারে।
অস্ট্রেলিয়ার গবেষক হিদার ফোর্ড বলেছেন, সেবুয়ানো উইকিপিডিয়ার ডেটাভিত্তিক নিবন্ধ এবং ইংরেজি উইকিপিডিয়ার মানুষের দৃষ্টিকোণ থেকে লেখা বর্ণনা তুলনা করলে বোঝা যায় যে, তথ্যের উপস্থাপন ভাষার ভিত্তিতে ভিন্ন হয়।
এদিকে ড. ইয়োহানসন জোর দিয়ে বলেন, এলএসজেবট নতুন কিছু বানায় না, শুধু ডেটা দিয়ে প্রস্তুত ফর্মুলায় তথ্য বসায়। তবে জেনারেটিভ এআই (যেমন চ্যাটজিপিটি) তথ্য ‘উদ্ভাবন’ করে, যা বাস্তব নয় এবং বিশ্বাসযোগ্যতার ঝুঁকি তৈরি করে।
তারপরও তিনি মনে করেন, জেনারেটিভ এআই ভাষাগত সহায়তা ও স্টাইল ঠিক করতে কাজে আসতে পারে। তবে মানব সম্পাদকের যাচাই অপরিহার্য।
গবেষণায় দেখা গেছে, উইকিপিডিয়ার ১-৫ শতাংশ পর্যন্ত এআই দিয়ে তৈরি হতে পারে। তবে যদি এই সংখ্যা বাড়ে, তবে রক্ষণাবেক্ষণ অসম্ভব হয়ে উঠতে পারে, যেমনটা সেবুয়ানোর ক্ষেত্রে হয়েছে।
লিম বলেন, ‘আমরা নির্ভরযোগ্য, তবে ভুল করতে পারি। তাই তথ্য নিয়ে ঈশ্বরসুলভ ক্ষমতার আচরণ করা উচিত নয়।’
তথ্যসূত্র: এবিসি নিউজ
বিশ্বের সবচেয়ে বড় অনলাইন বিশ্বকোষ উইকিপিডিয়ার ইংরেজি সংস্করণে আর্টিকেল বা নিবন্ধের সংখ্যা ৭০ লাখের কাছাকাছি। তবে দ্বিতীয় বৃহত্তম সংস্করণটি ফরাসি, স্প্যানিশ বা চীনা ভাষায় নয়—এটি ফিলিপাইনের দক্ষিণাঞ্চলে প্রচলিত স্থানীয় ভাষা সেবুয়ানোয় লেখা হয়েছে। এই সংস্করণের নিবন্ধ সংখ্যা ৬০ লাখেরও বেশি। আর অবাক করা বিষয় হলো সেবুয়ানো উইকিপিডিয়ার অধিকাংশ নিবন্ধ লিখেছেন একজন ব্যক্তি—সুইডিশ ভাষাবিদ সভারকার ইয়োহানসন। তবে হাতে নয়, এক স্বয়ংক্রিয় প্রোগ্রামের মাধ্যমে। এই প্রোগ্রামের নাম এলএসজেবট।
যেভাবে কাজ করে এলএসজেবট
উইকিপিডিয়ায় নানা ধরনের কাজ সহজ করতে বহু বছর ধরেই বট বা স্বয়ংক্রিয় প্রোগ্রাম ব্যবহার হয়ে আসছে। এরা সাধারণত সাইট ঘুরে ডেড লিংক ঠিক করা বা সংক্ষিপ্ত নিবন্ধ তৈরি করার মতো কাজ করে।
২০১০ দশকের শুরুতে, উইকিপিডিয়ায় লিখতেন সভারকার ইয়োহানসন। তখনই তিনি এই স্বয়ংক্রিয় নিবন্ধ-লেখক বটগুলোর সঙ্গে পরিচিত হন।
এরপর তিনি তৈরি করেন এলএসজেবট নামের বিশেষ প্রোগ্রাম। এটি বিভিন্ন অনলাইন ডেটাবেস থেকে তথ্য সংগ্রহ করে নির্দিষ্ট কিছু বাক্য কাঠামোতে বসিয়ে নিবন্ধ তৈরি করে।
উদাহরণস্বরূপ, কোনো প্রাণীর ওপর একটি নিবন্ধের শুরুতে লেখা থাকতে পারে—‘দ্য এক্স ইজ অ্যা ওয়াই বিলংগস টু দ্য জেড ফ্যামিলি’। এখানে এক্স, ওয়াই এবং জেড জায়গাগুলো ফাঁকা থাকে। এখানে এক্স=লাইওন (সিংহ), ওয়াই=ম্যামল (স্তন্যপায়ী), জেড=ক্যাট (বিড়াল)। তাহলে সম্পূর্ণ বাক্যটি দাঁড়ায়–‘দ্য লাইয়ন ইজ অ্যা ম্যামল দ্যাট বিলংগস টু দ্য জেড ক্যাট ফ্যামিলি।’ এভাবে তৈরি হয় লাখ লাখ নিবন্ধ।
ঠিক এইভাবে, এলএসজবট নামের প্রোগ্রামটি একটি নির্দিষ্ট ফরম্যাটে বা টেমপ্লেটে তথ্য বসিয়ে অসংখ্য নিবন্ধ তৈরি করত। এটি মূলত ডেটাবেইস থেকে তথ্য নিয়ে বানানো নির্দিষ্ট বাক্যের ছাঁচে ফেলে লেখা তৈরি করত—কোনো নতুন কথা বা ব্যাখ্যা তৈরি করত না।
বটটি মূলত জীববিজ্ঞান ও ভূগোলভিত্তিক তথ্য ব্যবহার করে উদ্ভিদ ও প্রাণীদের নিয়ে এখন পর্যন্ত প্রায় ২০ লাখ নিবন্ধ এবং ভৌগোলিক স্থান নিয়ে ৪০ লাখ বিভিন্ন নিবন্ধ তৈরি করেছে।
সেবুয়ানো ভাষায় কাজ করার পেছনে ইয়োহানসনের ব্যাখ্যা ছিল ব্যক্তিগত। তাঁর স্ত্রীর মাতৃভাষা সেবুয়ানো। তিনিই বাক্য কাঠামো তৈরিতে সাহায্য করেন।
এলএসজেবট নিয়ে বিতর্ক
সেবুয়ানো উইকিপিডিয়ায় এলএসজেবট ব্যবহার নিয়ে তীব্র বিতর্ক তৈরি হয়। বটের তৈরি অসংখ্য নিবন্ধে ব্যাকরণগত ভুল ও তথ্যগত ত্রুটি পাওয়া যায়। অনুবাদগুলো ছিল অসম্পূর্ণ বা ভুল হওয়ার কারণে এই সমস্যা তৈরি হয়।
অতিরিক্ত সংখ্যক নিবন্ধ তৈরি করাও এই সমস্যার কারণ হয়। এ ছাড়া সম্পাদক স্বল্পতার কারণে এই বিশাল তথ্যভান্ডার ত্রুটিমুক্ত করাও কঠিন হয়ে পড়ে।
এমনকি পুরো সেবুয়ানো উইকিপিডিয়া মুছে ফেলার প্রস্তাবও আসে ২০১৮ সালে, যা পরে বাতিল করা হয়।
ফিলিপাইনের আরেক উইকিপিডিয়ান ইরভিন স্টো. তোমাস জানান, কিছু স্থানীয় স্বেচ্ছাসেবক এখনো চেষ্টা চালিয়ে যাচ্ছেন গুণগত মান উন্নয়নে এবং ড. ইয়োহানসনের সঙ্গেও কাজ করেছেন।
এদিকে উইকিপিডিয়ার লেখক জোশ লিম বলেন—বট ব্যবহারের কারণে আগে থেকেই বিশ্বাসযোগ্যতার সমস্যা তৈরি হয়েছে। সেবুয়ানো উইকিপিডিয়ার প্রাথমিক পর্যায়ে বহু ফরাসি গ্রাম নিয়ে নিবন্ধ ছিল, অথচ স্থানীয় বিষয় ছিল অপ্রতুল। এটি একটি ‘লজ্জাজনক’ বিষয় হয়ে দাঁড়ায়। বটের কারণে ভাষাভিত্তিক উইকিপিডিয়াগুলোর মধ্যে ‘পরিমাণের প্রতিযোগিতা’ শুরু হয়, যাতে গুণমান উপেক্ষিত হয়।
লিম আরও বলেন, সমালোচনা থাকলেও ইয়োহানসনের উদ্দেশ্য ছিল নিষ্ঠার সঙ্গে জ্ঞানের প্রসার ঘটানো। তিনি বলেন, বট বা স্বয়ংক্রিয় প্রযুক্তিকে পুরোপুরি বাদ দেওয়া ঠিক নয় বরং সঠিকভাবে ব্যবহার করতে শিখতে হবে।
২০২১ সাল থেকে এলএসজেবট নিষ্ক্রিয় এবং বিতর্কই এর পেছনে অন্যতম কারণ বলে জানান ইয়োহানসন নিজেই।
উইকিপিডিয়ায় স্থানীয় ভাষার অবমূল্যায়ন ও জেনারেটিভ এআইয়ের চ্যালেঞ্জ
ড. ইয়োহানসনের তৈরি এলএসজেবট বন্ধ হয়ে যায়, কারণ এটি সেবুয়ানো উইকিপিডিয়ায় বেশি পাঠক তৈরি করতে পারেনি। সাইটে লাখো নিবন্ধ থাকলেও, পাঠক ছিল হাজার হাজার। অন্যদিকে, ইংরেজি উইকিপিডিয়া প্রতি মাসে ১০ কোটির বেশি ফিলিপাইনের পাঠক পায়।
উইকিপিডিয়ান জোশ লিম বলেন, এটা ফিলিপাইনের সমাজে ঔপনিবেশিক মানসিকতার প্রতিফলন, যেখানে মাতৃভাষাকে অবমূল্যায়ন করা হয়। এর ফলে স্থানীয় ভাষায় তথ্যের ঘাটতি তৈরি হয়। তবে তিনি মনে করেন, বর্তমানে নিজস্ব ভাষা নিয়ে মানুষের মধ্যে নতুন করে আগ্রহ ও সচেতনতা তৈরি হচ্ছে এবং উইকিপিডিয়া এতে বড় ভূমিকা রাখতে পারে।
অস্ট্রেলিয়ার গবেষক হিদার ফোর্ড বলেছেন, সেবুয়ানো উইকিপিডিয়ার ডেটাভিত্তিক নিবন্ধ এবং ইংরেজি উইকিপিডিয়ার মানুষের দৃষ্টিকোণ থেকে লেখা বর্ণনা তুলনা করলে বোঝা যায় যে, তথ্যের উপস্থাপন ভাষার ভিত্তিতে ভিন্ন হয়।
এদিকে ড. ইয়োহানসন জোর দিয়ে বলেন, এলএসজেবট নতুন কিছু বানায় না, শুধু ডেটা দিয়ে প্রস্তুত ফর্মুলায় তথ্য বসায়। তবে জেনারেটিভ এআই (যেমন চ্যাটজিপিটি) তথ্য ‘উদ্ভাবন’ করে, যা বাস্তব নয় এবং বিশ্বাসযোগ্যতার ঝুঁকি তৈরি করে।
তারপরও তিনি মনে করেন, জেনারেটিভ এআই ভাষাগত সহায়তা ও স্টাইল ঠিক করতে কাজে আসতে পারে। তবে মানব সম্পাদকের যাচাই অপরিহার্য।
গবেষণায় দেখা গেছে, উইকিপিডিয়ার ১-৫ শতাংশ পর্যন্ত এআই দিয়ে তৈরি হতে পারে। তবে যদি এই সংখ্যা বাড়ে, তবে রক্ষণাবেক্ষণ অসম্ভব হয়ে উঠতে পারে, যেমনটা সেবুয়ানোর ক্ষেত্রে হয়েছে।
লিম বলেন, ‘আমরা নির্ভরযোগ্য, তবে ভুল করতে পারি। তাই তথ্য নিয়ে ঈশ্বরসুলভ ক্ষমতার আচরণ করা উচিত নয়।’
তথ্যসূত্র: এবিসি নিউজ
ইউটিউব মনিটাইজেশন চালু করে ভিডিও থেকে অর্থ উপার্জনের সুযোগ পান কনটেন্ট নির্মাতারা। তবে এই সুযোগ নিতে হলে নির্দিষ্ট কিছু শর্ত পূরণ করে ইউটিউব পার্টনার প্রোগ্রামে আবেদন করতে হয়।
১২ ঘণ্টা আগেকৃত্রিম বুদ্ধিমত্তাভিত্তিক চ্যাটবট চ্যাটজিপিটিতে ‘স্টাডি মোড’ নামের নতুন ফিচার চালু করেছে ওপেনএআই। এই ফিচার একজন বাস্তব শিক্ষকের মতো শিক্ষার্থীদের নিজস্ব বিশ্লেষণ ও চিন্তাশক্তি গড়ে তুলতে সাহায্য করবে। স্টাডি মোড চালু থাকলে চ্যাটজিপিটি সরাসরি উত্তর দেওয়ার বদলে ব্যবহারকারীকে ধাপে ধাপে প্রশ্ন করে
১ দিন আগেযুক্তরাষ্ট্রের চিপ নির্মাতা প্রতিষ্ঠান এনভিডিয়ার তৈরি কৃত্রিম বুদ্ধিমত্তা এইচ ২০ চিপের সম্ভাব্য নিরাপত্তা ঝুঁকি নিয়ে উদ্বেগ প্রকাশ করেছে চীন। এই চিপে নিরাপত্তা বা নজরদারির ঝুঁকি রয়েছে কিনা তা জানতে কোম্পানিটিকে তলব করেছে চীনের সাইবার রেগুলেটরি সংস্থা সাইবারস্পেস অ্যাডমিনিস্ট্রেশন অব চায়না (সিএসি)।
১ দিন আগেজনপ্রিয় ভিডিও শেয়ারিং প্ল্যাটফর্ম টিকটক অভিভাবকদের জন্য নতুন নিয়ন্ত্রণ সুবিধা চালু করেছে। ‘ফ্যামিলি পেয়ারিং’ নামের এই নতুন ফিচারের মাধ্যমে এখন অভিভাবকেরা তাদের সন্তানদের (১৩ থেকে ১৭ বছর বয়সী) অ্যাকাউন্টের সঙ্গে নিজের অ্যাকাউন্ট লিংক করতে পারবেন এবং বিভিন্ন গোপনীয়তা সেটিংস নিয়ন্ত্রণ করতে পারবেন।
১ দিন আগে