বুকের এক্সরের ছবি থেকে করোনা নির্ণয়ের পদ্ধতি: বাস্তব পরিপ্রেক্ষিত– সমস্যা এবং সম্ভাবনা

  © টিডিসি ফটো

বুকের এক্সরের ছবি থেকে কৃত্রিম বুদ্ধিমত্তার সাহায্য রোগ কিংবা বস্তু নির্ণয়ের পদ্ধতিটি নতুন নয় বরং বেশ পুরনো। এক্সরের ছবি থেকে হৃদরোগ, পারকিনসন্স রোগ কিংবা অ্যালজেইমারস শনাক্ত করার পদ্ধতি রয়েছে। এছাড়াও কাস্টমসের বিভিন্ন পণ্য শনাক্তকরণ এর উপরেও অনেক কাজ আছে। বিভিন্ন গবেষণাপত্র পড়লে বা বিষয়টি নিয়ে একটু ইন্টারনেট সার্চ করলে বিষয়টি সম্পর্কে জানতে পারবেন।

এখন আসি কোভিড-১৯ শনাক্ত করার বিষয়টিতে। কোভিড ১৯ আক্রান্ত ব্যাক্তি বিশেষ ধরণের নিউমোনিয়ায় আক্রান্ত হন এবং তিনি যখন এক্সরে করেন এই এক্সরেতে ফুসফুস এবং বক্ষপিন্ডের কিছু ভিন্ন উপসর্গ পরিলক্ষিত হয় যার সাহায্যে এই এক্সরের ছবিকে সাধারণ এক্সরের ছবির সাথে তুলনা করে একটি ফলাফল দেয়া হয়। পুরো বিষয়টি ইমেজ রিকগনিশন এর মাধ্যমে করা হয় যেখানে অন্তর্ভুক্ত ডেটা কালেকশন, প্যাটার্ন ম্যাচিং, মডেল ট্রেইনিং এসব বিষয়াদি-বিশেষভাবে বললে এখানে সিএনএন বা কনভলিউশনাল নিউরাল নেটওয়ার্ক ব্যবহার করা হয়। মূলত চাইনিজ গবেষকরা বুকের এক্সরের ছবি থেকে করোনা নির্ণয়ের এর টুল এবং মডেল তৈরি করেন যা সম্পর্কে তথ্যসূত্র পাওয়া যায়। এসব বিষয় নিয়ে আলোচোনা করার আগে সময়ক্রম অনুসারে এর কার্যকারিতা নিয়ে কিছু উপাত্ত উপস্থাপন করি– 

১) ফেব্রুয়ারি ৯, ২০২: জর্ডান মাইকেল বেনেট নামের একজন গবেষক চাইনিজ গবেষকদের কাছ থেকে কিছু নিউমোনিয়া আক্রান্ত রোগীর বুকের এক্সরের ছবি সংগ্রহ করেন এবং artificial intelligence based Xray Image Scan diagnostics চালান এবং এই ধারণার উপর ভিত্তি করে একটি টুল এবং মডেল দাড়া করানোর চেষ্টা করেন।

২) ফেব্রুয়ারি ১৯, ২০২০: বিজ্ঞানীরা রেডিওলজি-সিটি স্ক্যান চিত্রভিত্তিক ডায়াগনস্টিক্স এর সাথে সিডিসির জনপ্রিয় ডিএনএ পলিমারেজ চেইন প্রতিক্রিয়া (https://tinyurl.com/wy5grtx)পদ্ধতির শতকরা ৯৮ ভাগ সঠিকতা নিরূপণ করতে সক্ষম হন।

৩) ফেব্রুয়ারি ২০, ২০২০: খবর পাওয়া যায় চাইনিজ গবেষকরা কৃত্তিম বুদ্ধিমত্তার সাহায্যে করোনা নির্ণয়ের পদ্ধতি উদ্ভাবন করেছে (https://tinyurl.com/u6tqfh3) যদিও এর বাস্তবভিত্তিক কোন সোর্স কোড কিংবা গবেষণা পদ্ধতির সম্পর্কে কোন তথ্য তারা কোথাও প্রকাশ করেনি।

৪) ফেব্রুয়ারি ২৬, ২০২০ঃ চাইনিজ গবেষকরা তাদের করোনা শনাক্তকরণ এর একটি টুল প্রকাশ করেন যা CT Angel নামে প্রকাশ পায় (https://tinyurl.com/sbm3da7) যদিও এই টুলের কোন সোর্স কোড ,কিংবা অ্যালগরিদম এর সম্পর্কে কোন তথ্য প্রকাশ করেনি।

৫) মার্চ ১৩ , ২০২০: কোভিড ১৯ এর সাথে লড়াই করার জন্য ক্যাগেল এ Allen Institute For AI তাদের একটি বিশাল ডেটাসেট প্রকাশ করে (https://tinyurl.com/u5jtdp5 )

৬) মার্চ ১৬, ২০২০: অ্যাডরিয়ান রোজব্রক নামের একজন গবেষক করোনা শনাক্ত করার একটি মডেল উপস্থাপন করেন (https://tinyurl.com/vvz9zd6) যেখানে তিনি কিছুদিন আগে গিটহাবে প্রকাশ হওয়া একটি ডেটাসেট ব্যাবহার করেন (https://tinyurl.com/tbt6ay8) যেখানে স্পষ্টভাবে বলা রয়েছে, please do not claim diagnostic performance of a model without a clinical study! This is not a kaggle competition dataset. মূলত তিনি এই কাজটিতে কিভাবে ডেটাসেট তৈরি করেছেন এবং কিভাবে বাছাই প্রক্রিয়ার মাঝে দিয়ে গিয়ে স্যাম্পলকে পৃথক করেছেন।

৭) মার্চ ২২, ২০২০: জর্ডান এবং অ্যাডরিয়ান এর পরে Linda Wang, Alexander Wong, Zhong Qiu Lin, James Lee, Paul McInnis একটি মডেল এবং একটি টুল প্রকাশ করেন (https://tinyurl.com/tzy7xbs) এখানে তারা মূলত একটি মাল্টি ক্লাস ডিটেকশন এর কাজ করার চেস্টাকরেন যা শতকরা ৮০ শতাংশ সঠিকতা প্রদর্শন করে।তাদের মডেল টি মূলত জর্ডান মাইকেল এর তৈরি করা মডেলের সঙ্গে কিছুটা মিল পাওয়া যায়।

এবার আসি ব্যাবহারিক ক্ষেত্রে–

৮) এই কাজটি করার জন্য মূলত কি কি জানা থাকা প্রয়োজন ?
Tensorflow
OpenCV
Python
Numpy
OpenCV
Scikit-Learn
Matplotlib

হয়তোবা ডেটাসেটের জন্য আরও লাগতে পারে–

PyDicom
Pandas
Jupyter

৯) প্রশ্ন হচ্ছে এই পদ্ধতি কতটা সঠিক?
এই প্রশ্নের উত্তর দেয়ার জন্য আরও বেশি গবেষণা এবং গবেষণালব্ধ ফলাফল এর প্রয়োজন, কেন প্রয়োজন কারণ মেশিন কে একটি ছবি চিনিয়ে দিলে সে শুধু সেই ছবিটি চিনবে এবং তার ভিত্তিতে ফলাফল দেবে এখানে যেটা প্রয়োজন সেটা হচ্ছে ছবির বৈশিষ্ট্য শক্ত করা এবং সঠিকভাবে তা যাচাই করে ডেটাসেট তৈরি করে কাজটি করা। এই কাজটি ঠিক এই মুহূর্তেই করা কঠিন কারণ করোনা তার বৈশিষ্ট্য প্রতিনিয়ত পরিবর্তন করছে এবং অভিযোজন প্রক্রিয়ার মধ্যে দিয়ে যাচ্ছে তাই কেউ যদি বলে এমন একটি মডেল থেকে তৈরি করা টুল ১০০ ভাগ সঠিক সে আপনাকে ভুল বলছেন। 

এটি সঠিক হবার আরেকটি মাপকাঠি হল লক্ষণ এবং উপসর্গসমূহ সংযোজন করা এবং তার ভিত্তিতে সিদ্ধান্ত নেয়া।

আমরা দেখেছি অনেক প্রতিষ্ঠান সার্ভেভিত্তিক প্রশ্ন উত্তর এর অ্যাপ্লিকেশান তৈরি করছে যেখানে করোনা সংক্রান্ত কিছু সাধারন প্রশ্ন যেমন সর্দি, কাশি, শ্বাসকষ্ট এগুলোর উপরে ফলাফল দিচ্ছে, এটি সঠিক নয় কারন তারা আসলে কোন নির্দিষ্ট সংখ্যক রোগীর তথ্যকে কোন লার্নিং পদ্ধতির মাধ্যমে কোন মডেল তৈরি করে এটা করছে না, করছে শুধুমাত্র কিছু প্রশ্ন-উত্তর এর ভিত্তিতে এই ধরণের যদি মডেল তৈরি করে তার সাথে বুকের এক্সরের ছবি মিলিয়ে এরপর সংযোজিত একটি ফলাফল দেয়া যায় তাহলে সেটা হবে সঠিক।

১০) এটা কেন এখন সম্ভব না ?
ঐ যে বললাম করোনা আক্রান্ত ব্যাক্তিদের সম্পর্কে ডেটাসেট এবং তার ভিত্তিতে ফলাফল অনেকটাই অপ্রতুল, কারণ হচ্ছে ভাইরাসটির বৈশিষ্ট্য, সাথে লক্ষণ এবং উপসর্গ বারবার পরিবর্তিত হচ্ছে।

১১) ভিডিওতে যে অ্যাপ্লিকেশানটি দেখছেন এটি কি আমার আবিস্কার?
না এটি আমি তৈরি করেছি, আমি উপরে যেসকল রেফারেন্স দিয়েছি তাদের দেয়া মডেল এবং ডেটাসেট ব্যাবহার করে করেছি, আমার অবদান এটুকুই হতে পারেন আমি মডেল টিকে একটি ওয়েব অ্যাপ্লিকেশান আকারে তৈরি করেছি কিন্তু আমি এর আবিস্কারক নই। শুধুমাত্র অ্যাপ্লিকেশান টিকে বিবেচনায় আনলে আমি বলে পারি আমি এর ‘উদ্ভাবক’ কারণ মডেল এবং ডেটাসেট কোনটাই আমার তৈরি নয়।

১২) কেউ কি এক্সরে থেকে করোনা শনাক্ত করার পদ্ধতি নিজের আবিস্কার বলে দাবি করতে পারেন ?
অবশ্যই পারেন, কিন্তু তাকে অবশ্যই কিছু প্রশ্নের উত্তর দিতে হবে–
ক) তিনি কোথায় ডেটা পেয়েছেন
খ) মডেল কিভাবে তৈরি করেছেন
গ) এর বৈজ্ঞানিক ব্যাখ্যা এবং সমীকরণ
ঘ) এর ব্যাবহারিক কার্যকারিতা
ঙ) তার কাজটিকে কোন গবেষণাপত্র আকারে প্রকাশ করা।

১৩) তাহলে যারা এর মডেল তৈরি করেছেন তারা কোন গবেষণাপত্র কেন করছেন না ?
কাজ যে হচ্ছে না তা বলা ভুল, অনেকেই করছেন, সমস্যা হচ্ছে-এখন মডেল তৈরি এবং ডেটাসেট দুটি জিনিস অপ্রতুল। কারণ এই পদ্ধতি এখন ও সঠিক ফলাফল দিতে পারছে না তাই অনেক দেশেই এটিকে গ্রহণ করা হয়নি

১৪) যদি কাজটি বিতর্কিত হয় তবে আমি বা অন্যরা কেন এটি নিয়ে আগ্রহী ?
একটা প্রবাদ বাক্য আছে ‘সময় এবং স্রোত কারো জন্য অপেক্ষা করেনা’, বুকের এক্সরে থেকে করোনা শনাক্ত করন পদ্ধতি যদিও অনেক ভুলভাল ফলাফল দিচ্ছে তবুও এটি কার্যকরী পদ্ধতি, এটি নিয়ে গবেষণা চালিয়ে গেলে নিশ্চয়ই আরও ভাল মডেল এবং অ্যাপ্লিকেশান তৈরি করা যাবে।

এই দীর্ঘ লেখার মূল উদ্দেশ্য হল পৃথিবীর এই ক্রান্তিলগ্নে আমরা যা কিছু করি তা অবশ্যই মানব কল্যাণে হওয়া জরুরি, কোন বিশেষ স্বার্থ উদ্ধার এর জন্য নয়। এই ধরনের কাজ যে বা যারা করছেন তাদের তিরস্কার না করে আমরা যদি বিষয়টির ব্যাপকতা এবং গভীরতা নিয়ে চিন্তা করে কিছু করতে পারি হয়তো করোনা শনাক্তের গবেষণায় আমরাও ভাল কিছু করতে পারব !

লেখক: সফটওয়্যার প্রকৌশলী এবং সাইবার নিরাপত্তা গবেষক
মেইল: rashed@cybertrendz-inc.com


সর্বশেষ সংবাদ