فیوتاک: فصل دوم اپیزود پنجم

تجربه هوش مصنوعی و آینده

گفتگوی پوریا حداد، بنیان‌گذار مجموعه هوش مصنوعی فیلاگر با دکتر مسعود کاویانی، دانشمند ارشد داده در فیلیمیو و زبراکت آلمان درباره آینده هوش مصنوعی و تجربه آن در ایران

تصویری از گفتگو با دکتر کیوانی

معرفی

فیوتاک، سلسله گفتگوهایی است با خبرگان درباره آینده و فناوری. در این اپیزود از سلسه گفتگوهایی درباره‌ی هوش مصنوعی و آینده، پوریا حداد، مدیرعامل شرکت هوش مصنوعی فیلاگر با دکتر مسعود کاویانی، دانشمند ارشد داده در فیلیمیو و زبراکت آلمان و متخصص در حوزه‌های یادگیری ماشین و علم داده، درباره اقتصاد هوش مصنوعی، درباره‌ی کاربردهای هوش مصنوعی و یادگیری ماشین در زندگی روزمره و صنایع مختلف صحبت کرده‌اند. 

گفتگو با دکتر مسعود کاویانی نشان می‌دهد که هوش مصنوعی و یادگیری ماشین، پتانسیل عظیمی برای ایجاد تحولات اساسی در زندگی انسان‌ها و صنایع مختلف دارند. با توجه به چالش‌های موجود، نیاز به توسعه زیرساخت‌های مناسب و وضع قوانین شفاف برای بهره‌برداری بهینه از این فناوری‌ها ضروری است. همچنین، آماده‌سازی جامعه برای تغییرات آینده در بازار کار و مشاغل، از اهمیت بالایی برخوردار است.

این گفتگو با حمایت ویژه صندوق پژوهش فناوری غیر دولتی فناوری‌های نوظهور دیجیتال و دبیرخانه برنامه ملی آینده نگاری علم و فناوری ایران و همراهی مجموعه ویکست و انجمن مدیریت فناوری و نوآوری ایران و با تهیه‌کنندگی صابر خسروی تهیه و تولید شده است.

ویدئو
پادکست
متن گفتگو

پوریا حداد: سلام و خوش آمدید به پلتفرم FutureOf.ir. در این برنامه، ما درباره آینده تکنولوژی و فناوری صحبت می‌کنیم. امروز میزبان دکتر مسعود کاویانی، دانشمند ارشد داده فیلیمو و آپارات و متخصص علم داده شرکت Zebracat آلمان هستیم. دکتر کاویانی، خیلی خوش آمدید به FutureOf.ir. خوشحالیم که در خدمت شما هستیم.

دکتر کاویانی: سلام و درود بر شما و بینندگان عزیز. مسعود کاویانی هستم، در حال حاضر به عنوان دانشمند ارشد داده در شرکت صبا ایده (فیلیمو و آپارات) و مهندس یادگیری ماشین در شرکت Zebracat آلمان فعالیت می‌کنم. همچنین در دانشگاه‌های مختلفی از جمله دانشگاه رجایی، جهاد دانشگاهی، صنعتی شریف و دانشگاه بهشتی دروسی در حوزه هوش مصنوعی تدریس می‌کنم. علاوه بر این، مشاور یادگیری ماشین در شرکت همراه اول و مرکز نوآوری علم داده هستم و چندین سال است که در زمینه یادگیری ماشین، هوش مصنوعی و علم داده فعالیت می‌کنم.

پوریا حداد: بسیار عالی. بیایید با این موضوع شروع کنیم که برای افرادی که ممکن است اطلاعات کافی نداشته باشند، وقتی می‌گوییم دانشمند داده یا دانشمند ارشد داده در یک شرکت، دقیقاً منظورمان چیست و درباره چه کسی صحبت می‌کنیم؟

دکتر کاویانی: ببینید، هر فعالیتی که کاربر در یک پلتفرم انجام می‌دهد، منجر به تولید داده می‌شود. مثلاً وقتی در گوگل یا آپارات جستجو می‌کنید، داده‌ای در آن شرکت ایجاد می‌شود. با افزایش حجم این داده‌ها، تحلیل و پردازش آن‌ها با استفاده از الگوریتم‌های معمول مهندسی نرم‌افزار امکان‌پذیر نیست. در نتیجه، ما باید از الگوریتم‌های یادگیری ماشین استفاده کنیم که این کار توسط یک متخصص علم داده انجام می‌شود. متخصص علم داده پس از چندین سال تجربه، به متخصص ارشد تبدیل می‌شود.

در واقع، هوش مصنوعی یک حوزه گسترده است که شامل بخش‌های مختلفی مانند یادگیری ماشین، علم داده، رباتیک، فلسفه و اخلاق هوش مصنوعی و حکمرانی داده می‌شود. وظیفه یک مهندس یادگیری ماشین این است که با استفاده از داده‌ها، یک سیستم هوشمند ایجاد کند. این سیستم می‌تواند به صورت نرم‌افزاری یا فیزیکی باشد.

پوریا حداد: بسیار خوب. حال می‌خواهم بپرسم، وقتی می‌گوییم فیلیمو و آپارات از هوش مصنوعی استفاده می‌کنند، دقیقاً منظورمان چیست و چه کاربردی برای کاربران دارد؟

دکتر کاویانی: به طور کلی، هر شرکتی، چه فیلیمو و آپارات، چه دیجی‌کالا، دیوار یا اسنپ، قبلاً یک سری کارها را به صورت دستی و با استفاده از نیروی انسانی انجام می‌داد. به عنوان مثال، در آپارات ما گزینه‌ای داریم به نام NSFW detection (تشخیص محتوای نامناسب). بسیاری از ویدیوها نباید در آپارات منتشر شوند، زیرا ممکن است محتوای نامناسب برای کاربران داشته باشند. این مسئله در یوتیوب، فیلیمو و سایر پلتفرم‌ها نیز وجود دارد.

قبلاً این کار توسط یک اپراتور انسانی انجام می‌شد که یک به یک ویدیوها را بررسی می‌کرد تا مناسب بودن آن‌ها را برای انتشار تأیید کند. اما اکنون این کار توسط هوش مصنوعی انجام می‌شود. به جای انسان، ما از یک الگوریتم هوش مصنوعی استفاده می‌کنیم که به صورت تخصصی به آن الگوریتم یادگیری ماشین می‌گوییم. این الگوریتم با سرعت بسیار بالاتر، به صورت 24 ساعته و بدون نیاز به مرخصی، تمام ویدیوها را بررسی می‌کند و بر اساس قواعدی که به آن آموزش داده شده، ویدیوها را فیلتر می‌کند.

مثلا اگر در یوتیوب محتوایی آپلود کنید که در آن خون دیده شود، سیستم به طور خودکار برچسب محدودیت می‌زند و به شما اطلاع می‌دهد که در این محتوا خون تشخیص داده شده است. این می‌تواند شامل مواردی مانند تیر خوردن یا زخمی شدن بدن باشد. سیستم به صورت هوشمند این موارد را تشخیص می‌دهد و دسترسی به ویدیوی شما را برای گروه محدودتری از افراد محدود می‌کند. ما در آپارات نیز از الگوریتم مشابهی استفاده می‌کنیم. همین الگوریتم در پلتفرم‌هایی مانند دیوار نیز کاربرد دارد، جایی که تصاویر آپلود شده باید قوانین خاصی را رعایت کنند. این فرآیند فیلترینگ دیگر توسط انسان انجام نمی‌شود، بلکه توسط یک سیستم هوشمند صورت می‌گیرد.

پوریا حداد: پس مدل‌هایی که شما از آن‌ها صحبت می‌کنید، با ویدیوها یا تصاویری که ایمن نیستند آموزش دیده‌اند، درست است؟

دکتر کاویانی: دقیقاً. ترکیبی از تصاویر ایمن و غیر ایمن به سیستم داده شده و ما تمایز بین آن‌ها را به سیستم آموزش داده‌ایم. در واقع، نام دیگر الگوریتم‌های یادگیری ماشین، الگوریتم‌های شناسایی تمایز است. مانند انسانی که می‌تواند بین تصویر مناسب و نامناسب تفاوت قائل شود، اگر الگوریتم بتواند چنین کاری انجام دهد، به آن الگوریتم هوشمند می‌گوییم. این الگوریتم با استفاده از مجموعه بزرگی از تصاویر یا ویدیوهای سالم و ناسالم آموزش می‌بیند و پس از آن می‌تواند به طور مستقل تصاویر را برای ما فیلتر کند.

پوریا حداد: بسیار خوب است که این موضوع را مطرح کردید. همانطور که شما و همه می‌دانند، پس از معرفی برخی مدل‌های زبانی مانند ChatGPT، هیجان زیادی در مورد هوش مصنوعی ایجاد شده است. بسیاری تصور می‌کنند که شروع تحولات هوش مصنوعی از حدود دو سال پیش بوده است. اکثر مردم هوش مصنوعی را بیشتر با هوش مصنوعی مولد می‌شناسند. اما واقعیت این است که شاید درصد استفاده از هوش مصنوعی در بخش‌های دیگر، که شما به برخی از آن‌ها اشاره کردید، بسیار بیشتر است، اگرچه افرادی که کمتر با این حوزه آشنا هستند، ممکن است کمتر از آن اطلاع داشته باشند.

من می‌خواهم بیشتر درباره این کاربردها صحبت کنیم. مثلاً، یکی از سیستم‌هایی که در فیلیمو و آپارات بسیار استفاده می‌شود، سیستم‌های توصیه‌گر است که بر اساس سوابق ویدیوهایی که قبلاً دیده‌اید، پیشنهاداتی برای تماشای بعدی ارائه می‌دهد. می‌توانیم درباره این موضوع نیز صحبت کنیم؟

دکتر کاویانی: البته. باید توجه داشت که عمومی‌سازی هوش مصنوعی با واقعیت آن تفاوت زیادی دارد. تصویری که عموم مردم از هوش مصنوعی می‌بینند، با آنچه در پشت صحنه اتفاق می‌افتد، متفاوت است. به قول شوپنهاور، مردم تصویری از هوش مصنوعی می‌بینند، اما پشت آن اتفاقات دیگری در جریان است. مثلاً همین مدل‌های زبانی بزرگ (LLM‌) که اکثریت جامعه در دو سه سال اخیر با آن‌ها آشنا شده‌اند، در واقع از دهه 1960 مورد مطالعه و توسعه بوده‌اند. ما حتی با نسخه‌های قبل از GPT-3 در سال‌های 2012 و 2013 کار می‌کردیم. اما از GPT-3 به بعد، به دلیل نتایج بسیار خوبی که به دست آمد، مردم توانستند بیشتر با آن ارتباط برقرار کنند و شناخت بیشتری پیدا کنند.

همانطور که اشاره کردید، بسیاری از کارهایی که هوش مصنوعی انجام می‌دهد، محدود به این کاربردهای عمومی مانند چت‌بات‌ها یا تولید محتوای صوتی و تصویری نیست. این‌ها کارهای جذابی هستند که توجه مخاطب را جلب می‌کنند، اما در واقع، بحث بسیار عمیق‌تر است و می‌توان آن را به یک کوه یخ تشبیه کرد که مردم تنها نوک آن را می‌بینند.

در مورد سیستم‌های توصیه‌گر که اشاره کردید، این یکی از سودآورترین بخش‌ها برای هر کسب و کاری است. هدف این است که کاربران را تا حد ممکن بیشتر در وب‌سایت نگه دارند، چه در دیجی‌کالا که می‌خواهد محصول بیشتری بفروشد، چه در فیلیمو و آپارات که می‌خواهند ویدیوهای بیشتری نمایش دهند و طبیعتاً تبلیغات بیشتری را به نمایش بگذارند. در گذشته، بخش توصیه‌گر معمولاً با استفاده از الگوریتم‌های ساده انجام می‌شد.

در گذشته، سیستم‌های توصیه‌گر بسیار ساده بودند. به عنوان مثال، اگر کاربری یک لپ‌تاپ از دیجی‌کالا خریداری می‌کرد، یک برنامه‌نویس الگوریتمی می‌نوشت که به طور خودکار یک موس را نیز به آن کاربر پیشنهاد دهد. اما امروزه، به دلیل افزایش چشمگیر حجم محصولات در فروشگاه‌های آنلاین مانند دیجی‌کالا یا تعداد ویدیوها در پلتفرم‌هایی مانند فیلیمو و آپارات، این روش‌های ساده دیگر کارآمد نیستند.

در حال حاضر، ما مجبور به استفاده از الگوریتم‌های پیشرفته هوش مصنوعی و یادگیری ماشین هستیم. این الگوریتم‌ها بر اساس علایق کاربر و الگوهای رفتاری او در بازه‌های زمانی مختلف، محتوا یا محصولات مناسب را پیشنهاد می‌دهند. به عنوان مثال، در فیلیمو، سیستم ممکن است تشخیص دهد که یک کاربر خاص صبح‌ها برنامه‌های کودک، بعدازظهرها فیلم‌های خانوادگی و شب‌ها فیلم‌های اکشن یا ترسناک را ترجیح می‌دهد.

پوریا حداد: بله، این الگوهای رفتاری پیچیده هستند و نمی‌توان آن‌ها را با برنامه‌نویسی ساده پیاده‌سازی کرد. آیا می‌توانید در مورد چگونگی عملکرد این الگوریتم‌ها در تشخیص محتوای ویدیوها توضیح دهید؟

دکتر کاویانی: بله، حتماً. در سطح قابل توضیح هوش مصنوعی، ما الگوریتم‌هایی داریم که می‌توانند محتوای ویدیو را بدون نیاز به تگ‌ها تشخیص دهند. برای مثال، تشخیص اینکه آیا یک ویدیو درباره ورزش، یک فیلم سینمایی یا یک آموزش آشپزی است. اما اگر بخواهیم عمیق‌تر به این موضوع نگاه کنیم، باید بگویم که الگوریتم‌ها مانند انسان‌ها فکر نمی‌کنند.

ما انسان‌ها با استفاده از مفاهیم و کلمات فکر می‌کنیم، اما الگوریتم‌ها در یک فضای برداری کار می‌کنند. به جای درک مفاهیم انتزاعی مانند “ورزش” یا “فیلم جنایی”، الگوریتم‌ها الگوهای داده‌ای را تشخیص می‌دهند. آن‌ها ممکن است عناصری مانند توپ، تور و چمن سبز را در یک ویدیوی ورزشی تشخیص دهند، اما لزوماً مفهوم “ورزش” را به شیوه انسانی درک نمی‌کنند.

هدف نهایی ما این است که کاربر را بیشتر در وب‌سایت نگه داریم. بنابراین، ما به الگوریتم می‌گوییم که هر الگویی را که در داده‌ها می‌بیند، تشخیص دهد. ما نگران این نیستیم که الگوریتم چگونه این کار را انجام می‌دهد یا چه نامی برای این الگوها می‌گذارد. ما فقط می‌خواهیم که الگوریتم بتواند پیش‌بینی کند که اگر کاربری صبح یک نوع خاص از محتوا را مشاهده کرده است، چه نوع محتوایی را احتمالاً بعدازظهر تماشا خواهد کرد.

در واقع، الگوریتم با استفاده از جبر خطی و فضاهای برداری کار می‌کند، نه با کلمات و مفاهیم انسانی. در نهایت، ما نتایج الگوریتم را می‌گیریم و رفتار کاربران را دنبال می‌کنیم تا ببینیم پس از مشاهده یک ویدیو، چه ویدیوی دیگری را احتمالاً تماشا خواهند کرد. این الگوهای رفتاری را سپس برای ارائه پیشنهادات به سایر کاربران استفاده می‌کنیم.

پوریا حداد: در این بخش، مایلیم درباره آینده فناوری، به ویژه مدل‌های بزرگ زبانی (LLM‌) صحبت کنیم. این مدل‌ها به نظر می‌رسد بخش قابل توجهی از آینده تکنولوژی را شکل خواهند داد. می‌خواهیم با جزئیات بیشتری به این موضوع بپردازیم و درباره جنبه‌هایی که باعث هیجان یا نگرانی شده‌اند، گفتگو کنیم. اما قبل از آن، بیایید توضیح دهیم که این مدل‌ها دقیقاً چه کاری انجام می‌دهند.

دکتر کاویانی: بله، حتماً. LLM در واقع یک مدل یادگیری ماشین است که می‌تواند کلمه بعدی را بر اساس مجموعه‌ای از کلمات قبلی پیش‌بینی کند. این مفهوم اصلی است که مدل‌های زبانی بزرگ حول آن شکل گرفته‌اند. آنچه برای کاربر جذاب می‌شود، این است که این کلمات پشت سر هم چیده شده، معنادار هستند. این قابلیت در مدل‌های قدیمی وجود نداشت.

با استفاده از ساختارهای پیچیده، این مدل‌ها می‌توانند تشخیص دهند که چه کلماتی را باید پشت سر هم قرار دهند. اگرچه چگونگی دقیق این فرآیند برای ما مشخص نیست و از دیدگاه انسانی یک جعبه سیاه محسوب می‌شود، اما می‌توانیم ببینیم که الگوریتم پس از درک یک موضوع، قادر است کلمات را به شکلی معنادار کنار هم قرار دهد.

پوریا حداد: بله، و این همان چیزی است که برای کاربران بسیار جذاب شده است. حال که کمی درباره ماهیت این مدل‌ها صحبت کردیم، می‌خواهم به یک سؤال مهم بپردازیم که احتمالاً برای بسیاری مطرح است. برخی تصور می‌کنند وقتی با مدل‌های زبانی مانند ChatGPT، Gemini از Google، یا سرویس‌های مشابه صحبت می‌کنند و پاسخی دریافت می‌کنند، این مدل‌ها واقعاً آگاهی دارند و می‌دانند چه پاسخی می‌دهند. مثلاً، برخی از مدل زبانی می‌پرسند که آیا قصد نابودی دنیا را دارد یا نه، و وقتی پاسخی می‌شنوند، با هیجان آن را منتشر می‌کنند. می‌توانید در این مورد توضیح دهید؟

دکتر کاویانی: بله، دقیقاً. ببینید، کسانی که با Google کار کرده‌اند – که تقریباً همه افراد این تجربه را دارند – می‌دانند که Google به هر سؤالی پاسخ می‌دهد. اما ما انسان‌ها، وقتی بزرگ شدیم، فهمیدیم که این Google نیست که مستقیماً پاسخ می‌دهد. Google در واقع فقط یک موتور جستجوست. مثلاً وقتی ما “طرز تهیه قورمه سبزی” را جستجو می‌کنیم، Google تمام سایت‌هایی که حاوی این عبارت هستند را برای ما فهرست می‌کند.

ChatGPT دقیقاً همین کار را انجام می‌دهد، با این تفاوت که به جای فهرست کردن سایت‌ها، کلماتی را که در آن سایت‌ها پشت سر هم آمده‌اند، جمع‌آوری کرده و بهترین ترکیب را برای ما خلاصه می‌کند. حتی در حال حاضر، وقتی شما برخی موضوعات تخصصی را در Google جستجو می‌کنید، در بالای صفحه خلاصه‌ای از بهترین نتایج را مشاهده می‌کنید.

در واقع، این مدل‌ها دانش پایه‌ای از خود ندارند. اگر از دیدگاه یک جستجوگر نگاه کنیم، LLM یک موتور جستجوست که حجم عظیمی از داده‌ها – شامل تمام وب‌سایت‌ها، Wikipedia جهانی، کتابخانه کنگره، و تقریباً تمام متون جمع‌آوری شده توسط انسان‌ها – را در اختیار دارد. وقتی شما سؤالی می‌پرسید، این مدل در میان این داده‌های عظیم جستجو می‌کند و می‌تواند کلمات را به صورت پیش‌فرض و با دقت بالا برای شما کنار هم قرار دهد.

پوریا حداد: پس خوب است که مخاطبان ما بدانند که وقتی درباره یک مدل زبانی صحبت می‌کنیم، لزوماً درباره آگاهی صحبت نمی‌کنیم، زیرا آگاهی مفهومی بسیار گسترده‌تر از آنچه ما در حال بحث درباره آن هستیم، می‌باشد. البته، این به این معنی نیست که این مدل‌های زبانی اهمیت کمی دارند. قطعاً این‌ها دستاوردهای بسیار ارزشمندی هستند که همه ما در حال استفاده از آن‌ها هستیم.

 بسیار خوب، حال می‌خواهم نظر شما را درباره تأثیر این فناوری بر آینده جویا شوم. به نظر شما، تأثیر این فناوری بر کسب‌وکارها، چه در ایران و چه در سطح بین‌المللی، چگونه خواهد بود؟ همچنین، چگونه این فناوری بر آینده مشاغلی که ما انسان‌ها انجام می‌دهیم، تأثیر خواهد گذاشت؟

دکتر کاویانی: بله، این سؤال بسیار مهمی است. در واقع، ما درباره تأثیر گسترده یادگیری ماشین، به ویژه یادگیری ماشین مولد، صحبت می‌کنیم. این فناوری قادر است کلمات، تصاویر، صدا و حتی ویدیو را به شکلی معنادار تولید کند. این قابلیت محدود به زبان نیست و می‌تواند در حوزه‌های مختلف کاربرد داشته باشد.

اخیراً خبری منتشر شد مبنی بر اینکه یک شرکت هندی حدود 200 یا 2000 نفر از کارکنان بخش پشتیبانی خود را به دلیل استفاده از یک سیستم یادگیری ماشین مولد برای پاسخگویی به سؤالات مشتریان، اخراج کرده است. این نشان می‌دهد که بسیاری از مشاغل روتین، مانند پاسخگویی تلفنی، رسیدگی به تیکت‌ها، ساخت ویدیوهای تبلیغاتی ساده، نگارش مقالات و تولید محتوای آموزشی، ممکن است به تدریج از بین بروند.

پوریا حداد: بله، به نظر می‌رسد که هوش مصنوعی مولد در مرحله اول می‌تواند بسیاری از مشاغل روتین را حذف کند. برای مثال، ویرایشگران ویدیو، نویسندگان مقالات علمی و غیرعلمی، و حتی سازندگان موسیقی ممکن است با چالش‌هایی مواجه شوند. در حال حاضر، هوش مصنوعی می‌تواند بسیاری از این وظایف را انجام دهد. به نظر می‌رسد که در فاز اول، مشاغلی که نیاز به خلاقیت پیچیده ندارند، توسط هوش مصنوعی مولد جایگزین خواهند شد. در فاز بعدی، ممکن است مشاغل خلاقانه‌تر نیز تحت تأثیر قرار گیرند.

دکتر کاویانی: دقیقاً. قبل از اینکه هوش مصنوعی مولد تا این حد پیشرفت کند و سخت‌افزارهای لازم برای اجرای الگوریتم‌های پیچیده با حجم بالای داده در دسترس قرار گیرد، تصور می‌شد که حوزه‌های هنری و خلاقانه آخرین بخش‌هایی خواهند بود که تحت تأثیر هوش مصنوعی قرار می‌گیرند. اما در واقع، این حوزه‌ها از اولین بخش‌هایی بودند که تحت تأثیر قرار گرفتند. ما شاهد پیشرفت‌های چشمگیری در زمینه تولید موسیقی، ساخت ویدیو و سایر هنرها بوده‌ایم.

پوریا حداد: بله، این نکته بسیار جالبی است. در مورد سخت‌افزار هم باید اشاره کنیم که بسیاری از الگوریتم‌های امروزی به پردازنده‌های گرافیکی قدرتمند نیاز دارند تا بتوانند با حجم بالای داده کار کنند و مدل‌ها را آموزش دهند. به طور خلاصه، ما به سه عنصر اصلی نیاز داریم: داده‌های زیاد، سخت‌افزار قوی و مدل‌هایی که بتوانند بین این دو ارتباط برقرار کنند.

پوریا حداد: اکنون می‌خواهم بدانم در مجموعه‌هایی که فعالیت می‌کنید، با چه چالش‌هایی روبرو هستید. از دیدگاه فردی که به صورت عملی در این حوزه با داده‌ها و سخت‌افزارها درگیر است، چه مشکلاتی را در ایران و خارج از کشور مشاهده می‌کنید؟

دکتر کاویانی: بله، مشکلاتی که در خارج از کشور وجود دارد، با تفاوت‌هایی در ایران نیز دیده می‌شود یا به زودی پدیدار خواهد شد. اولین چالش، بحث سخت‌افزار است. الگوریتم‌های یادگیری ماشین نیاز به پردازش بسیار زیادی دارند. مغز انسان هنگام تفکر، به دلیل فرآیندهای تکاملی، مانند یک لامپ 40 وات مصرف انرژی دارد. اما الگوریتم‌های یادگیری ماشین برای پاسخگویی سریع به میلیون‌ها کاربر، نیاز به انرژی بسیار بیشتری دارند.

پوریا حداد: درست است. این نیاز به انرژی بیشتر به معنای نیاز به برق بیشتر و GPU‌های قدرتمندتر است. در حال حاضر، یکی از بزرگترین محدودیت‌ها در جهان و به ویژه در ایران، همین محدودیت پردازنده است. در دنیای سرمایه‌داری غرب، این کار توسط شرکت‌های بزرگی مانند مایکروسافت، آمازون و گوگل انجام می‌شود. اما در شرق، مانند چین و ایران، بیشتر این کار توسط دولت‌ها صورت می‌گیرد.

دکتر کاویانی: بله، دقیقاً. در کشورهایی مانند ایران، چین یا هند، دولت‌ها بیشتر زیرساخت‌ها را ایجاد می‌کنند. دولت سرمایه‌گذاری کلان انجام می‌دهد، نه فقط برای 10 یا 20 سال آینده، بلکه برای 50 یا 100 سال آینده. آنها GPU می‌خرند، منابع تهیه می‌کنند و کلاسترها را می‌سازند. حتی برخی منابع طبیعی مانند مناطق سردسیر یا منابع زیر آب را برای خنک کردن GPU‌ها در اختیار شرکت‌ها قرار می‌دهند.

پوریا حداد: این نکته جالبی است. به نظر شما در سال‌های آینده، نیاز به این منابع سخت‌افزاری کمتر می‌شود؟ آیا این به دلیل گذر از فاز بزرگی از آموزش الگوریتم‌های اصلی است یا به این دلیل که الگوریتم‌ها یاد گرفته‌اند چگونه کارآمدتر از منابع استفاده کنند؟

دکتر کاویانی: بله، احتمالاً هر دو عامل نقش دارند. استفاده کارآمدتر از منابع در واقع همان یادگیری بیشتر است. الگوریتم‌ها به سطح عمیق‌تری از دانش می‌رسند که دیگر نیاز به آموزش بسیار زیادی ندارد. این مانند یک پروفسور در یک رشته خاص است که دیگر نیاز به مطالعه کتاب‌های پایه ندارد و می‌تواند با خواندن چند مقاله در ماه، کارش را پیش ببرد.

پوریا حداد: یک مشکل دیگر، بحث قانون‌گذاری است. ما هنوز داده را به عنوان یک دارایی به رسمیت نمی‌شناسیم. در دنیای مدرن، حق کپی‌رایت مطرح شده، اما داده هنوز به صورت یک دارایی شناخته نمی‌شود. نظر شما در این مورد چیست؟

دکتر کاویانی: مسئله مالکیت داده در دنیای دیجیتال امروز بسیار پیچیده است. به عنوان مثال، وقتی شما در گوگل جستجو می‌کنید، مثلاً “طرز تهیه قورمه سبزی”، این داده‌ای است که شما تولید کرده‌اید و قاعدتاً باید متعلق به شما باشد، اما گوگل از آن استفاده می‌کند. در حال حاضر، مالکیت داده به طور دقیق مشخص نیست.

پوریا حداد: بله، دقیقاً. این مسئله در مورد پلتفرم‌های دیگر مانند یوتیوب نیز صادق است. فرض کنید شخصی روزانه 20 تا 30 ویدیو در یوتیوب تماشا می‌کند. او از اینترنت و وقت خود استفاده می‌کند، اما یوتیوب است که داده‌های مربوط به این فعالیت را جمع‌آوری می‌کند. این موضوع در دنیای مدرن بسیار مورد بحث است.

دکتر کاویانی: درست است. اتحادیه اروپا در حال وضع قوانین سختگیرانه‌ای در مورد مالکیت داده است. در آنجا، شما می‌توانید داده‌های مربوط به خود یا خانواده‌تان را از پلتفرم‌هایی مانند یوتیوب درخواست کنید. اما در ایران، ما هنوز چنین مقرراتی نداریم. در حال حاضر، داده متعلق به کسی است که سرور دارد و آن را ذخیره می‌کند، که به نظر می‌رسد رویکرد درستی نیست.

پوریا حداد: این موضوع با تکامل وب نیز ارتباط دارد. در وب 1.0، ارتباط یک طرفه بود و مالک داده می‌توانست اطلاعات را منتشر کند و دیگران فقط می‌توانستند آن را بخوانند. در وب 2.0، افراد احساس کردند که می‌توانند داده‌های خود را در پلتفرم‌هایی مانند یوتیوب یا گوگل منتشر کنند، اما هنوز مالکیت واقعی داده وجود ندارد زیرا شرکت‌ها می‌توانند در هر زمان آن داده‌ها را حذف کنند.

دکتر کاویانی: بله، و در وب 3.0، احتمالاً به سمتی می‌رویم که مالکیت داده‌ها متعلق به افراد باشد. این می‌تواند از طریق فناوری‌هایی مانند NFT یا روش‌های دیگر انجام شود، جایی که مالکیت داده در یک شبکه به نام تولیدکننده یا مالک اصلی ثبت می‌شود.

این موضوع هنوز مورد بحث است. برخی مانند کمونیست‌ها معتقدند که همه چیز باید متعلق به همه باشد، در حالی که سرمایه‌داران می‌گویند داده متعلق به کسی است که برای آن پول پرداخت می‌کند. هنوز مشخص نیست که چه اتفاقی خواهد افتاد.

این مسئله برای کسب‌وکارها چالش‌برانگیز است، زیرا نمی‌دانند از کدام داده‌ها می‌توانند استفاده کنند. مثلاً در مورد ChatGPT، اگر یک وبسایت خبری مانند ایسنا خبری تولید کند و ChatGPT از آن یاد بگیرد، این یادگیری متعلق به چه کسی است؟ تولیدکننده خبر یا هوش مصنوعی؟

پوریا حداد: دقیقاً. این مسئله در مورد کتاب‌ها و سایر منابع آموزشی نیز صادق است. اگر یک هوش مصنوعی از کتابی که من نوشته‌ام یاد بگیرد و سپس از این دانش برای تولید کد یا ارائه خدمات API استفاده کند، آیا من باید سهمی از درآمد حاصل از این API داشته باشم؟

دکتر کاویانی: بله، این سؤال مهمی است. اگر این موضوع حل نشود، ممکن است شرکت‌های بزرگ فناوری بیش از حد قدرتمند شوند و افراد عادی که دانش اولیه را تولید کرده‌اند، نادیده گرفته شوند.

شرکت‌های بزرگ گاهی اوقات از روش‌های جسورانه‌تری استفاده می‌کنند. مثلاً گوگل در گذشته تعداد زیادی کتاب را بدون مجوز اسکن و دیجیتالی کرد. آنها می‌دانستند که این کار جریمه دارد، اما ترجیح دادند جریمه را بپردازند زیرا هزینه گرفتن مجوز برای هر کتاب بسیار بالاتر بود.

این استراتژی به آنها مزیت رقابتی قابل توجهی داد. احتمالاً بسیاری از مدل‌های یادگیری ماشین که امروزه استفاده می‌کنند، بر اساس همان داده‌های قدیمی است که جمع‌آوری کرده‌اند.

تفاوت بین این روش و روش‌های جدید یادگیری ماشین این است که در روش قدیمی، مثل اسکن کردن کتاب‌ها، منبع داده مشخص است و می‌توان آن را ردیابی کرد. اما در مدل‌های یادگیری ماشین مدرن، فرآیند یادگیری در یک “جعبه سیاه” انجام می‌شود که تشخیص منبع دقیق داده‌ها را دشوار می‌کند.

درست است که مدل از کتاب شما یادگیری را انجام داده، اما مشخص نیست که دقیقاً چگونه از این دانش استفاده می‌کند. ممکن است مفاهیم را به کار ببرد، اما تشخیص دقیق منبع دشوار است. با این حال، مالکیت معنوی همچنان متعلق به شماست و از نظر اخلاقی، باید جبران خسارتی صورت گیرد. در حال حاضر، این اتفاق نمی‌افتد و شرکت‌ها به فعالیت خود ادامه می‌دهند.

احتمالاً در آینده، اگر دولت‌ها قدرت کافی داشته باشند، شاهد وضع جریمه‌هایی برای این موارد خواهیم بود. این نه تنها برای مدل‌های زبانی بزرگ، بلکه برای تمام شرکت‌هایی که از هوش مصنوعی استفاده می‌کنند، اعمال خواهد شد. ممکن است از یک تاریخ مشخص به بعد، قوانینی وضع شود که استفاده از داده‌ها بدون پرداخت حق مالکیت به تولیدکننده اصلی را جریمه کند.

پوریا حداد: بله، این موضوع بسیار مهم است. حال، اجازه دهید در مورد وضعیت فعلی ایران در زمینه هوش مصنوعی و چشم‌انداز آینده صحبت کنیم. با توجه به محدودیت‌هایی که وجود دارد، از جمله مسائل سخت‌افزاری و مشکلات مربوط به دسترسی به داده‌ها، چه پیشنهادی برای افرادی که می‌خواهند در این حوزه فعالیت کنند، دارید؟

دکتر کاویانی: در ایران، ما با چالش‌ها و مزایایی روبرو هستیم. یکی از مزایای اصلی ما زبان فارسی است. ما حدود 120 میلیون نفر فارسی‌زبان داریم که می‌توانند زبان فارسی را درک کنند. این یک نقطه قوت قابل توجه است، زیرا بسیاری از استارت‌آپ‌های خارجی در زمینه هوش مصنوعی در کار با زبان فارسی ضعیف عمل می‌کنند.

بسیاری از استارت‌آپ‌های ایرانی در حال حاضر بر روی زبان فارسی و محتوای مخصوص منطقه ما، شامل ایران، افغانستان و پاکستان تمرکز کرده‌اند. این محتوا در خارج از کشور کمتر مورد توجه قرار گرفته و ما می‌توانیم در این زمینه پیشرفت قابل توجهی داشته باشیم.

مثلاً در حال حاضر برخی در حال کار بر روی یک مدل زبانی بزرگ فارسی هستند که می‌تواند پاسخ‌های پزشکی را به صورت پویا و به زبان فارسی ارائه دهد. این مدل می‌تواند با توجه به شرایط خاص ایران، مانند دسترسی به داروهای خاص، پاسخ‌های مناسبی ارائه دهد.

این نوع شخصی‌سازی و بومی‌سازی برای کاربران ایرانی می‌تواند یک مزیت رقابتی قابل توجه باشد.

یکی از مشکلات اصلی ما در ایران، کمبود نیروی متخصص است. با توجه به موج مهاجرت، ما با چالش‌هایی در این زمینه روبرو هستیم. ایجاد الگوریتم‌های پیشرفته نیازمند یک تیم متخصص و یک چشم‌انداز بلندمدت، حداقل 5 تا 6 ساله است.

این فرآیند شامل سنجش نیاز، پیاده‌سازی و ورود به بازار است که زمان‌بر است. بدون نیروی متخصص کافی، ما نمی‌توانیم چنین مدل‌هایی را بسازیم و از دنیا عقب می‌افتیم و اگر این فاصله زمانی بیشتر شود، ممکن است به نقطه‌ای برسیم که دیگر نتوانیم به سطح جهانی برسیم. الگوریتم‌ها به سرعت پیشرفت می‌کنند و اگر ما نتوانیم همگام شویم، ممکن است در آینده حتی نیروی لازم برای ساخت مدل‌های پیشرفته را نداشته باشیم.

در واقع، به نظر من منابع انسانی در ایران وجود دارد، اما انگیزه کافی برای ماندن و ادامه کار در این حوزه وجود ندارد. آینده‌ای که افراد باید ببینند تا برای ماندن و تکمیل پروژه‌های استارتاپی انگیزه پیدا کنند، شاید کمتر از انگیزه‌ای باشد که در خارج از ایران می‌توانند داشته باشند.

از طرفی، به دلیل محدودیت‌ها، ما نمی‌توانیم به راحتی از منابع سخت‌افزاری جهانی مانند آمازون و گوگل استفاده کنیم. اگر بخواهیم این زیرساخت‌ها را در ایران پیاده‌سازی کنیم، طبیعتاً بازده اقتصادی برای یک شرکت خصوصی نخواهد داشت. در اینجا دولت باید وارد شود و منابع سخت‌افزاری لازم را ایجاد کند تا افراد بتوانند ایده‌های خود را روی این منابع پیاده‌سازی کنند. حمایت دولتی می‌تواند نقش کلیدی در توسعه زیرساخت‌های لازم داشته باشد.

مسئله دیگر، بحث قانون‌گذاری است. افراد نگران هستند که اگر مدلی را بسازند و در آینده قوانین تغییر کنند، چه اتفاقی برای کار آنها خواهد افتاد. این موضوع ریسک سرمایه‌گذاری در حوزه هوش مصنوعی را بسیار بالا می‌برد. عدم ثبات قانونی می‌تواند مانع بزرگی برای نوآوری و سرمایه‌گذاری باشد.

اما از طرف دیگر، ما مزایایی هم داریم. همان‌طور که قبلاً اشاره کردم، به دلیل محلی بودن و تمرکز بر زبان فارسی، می‌توانیم در این حوزه مانور خوبی داشته باشیم و مدل‌های هوش مصنوعی مختص منطقه خودمان را ایجاد کنیم.

پوریا حداد: اگر بخواهیم سه مشکل اصلی یعنی منابع انسانی، سخت‌افزار و داده را در نظر بگیریم، به نظر شما کدام یک در چند سال آینده مهم‌ترین چالش خواهد بود؟

دکتر کاویانی: به نظر من، در حال حاضر منابع انسانی مهم‌ترین چالش است. چرا که فعلاً این منابع انسانی هستند که الگوریتم‌ها را می‌سازند. شاید 20 یا 30 سال بعد، خود الگوریتم‌ها بتوانند الگوریتم بسازند، اما در حال حاضر، منابع انسانی چالش اصلی ما هستند.پس از آن، می‌توانیم قانون‌گذاری، داده و منابع سخت‌افزاری را که معمولاً در ایران کمیاب هستند، در نظر بگیریم.

پوریا حداد: بسیار خوب، ممنون از صحبت‌های ارزشمندتان. آیا نکته دیگری هست که فکر می‌کنید خوب است در موردش صحبت کنیم و نکرده‌ایم؟

دکتر کاویانی: بله، اجازه دهید یک نکته کلی را اضافه کنم. در چند سال اخیر، هایپ‌های مختلفی از بلاک‌چین گرفته تا شبکه‌های اجتماعی مختلف مانند اینستاگرام، تیک‌تاک و دیسکورد به وجود آمده‌اند. به نظر می‌رسد همه اینها به تدریج کنار می‌روند، اما چیزی که من می‌بینم این است که بحث هوش مصنوعی حداقل تا 10 یا 20 سال آینده جزو هایپ‌هایی است که قرار نیست کنار برود.

پوریا حداد: این مقایسه جالبی است. می‌توانید بیشتر توضیح دهید؟

دکتر کاویانی: بله، زمانی می‌گفتند اینترنت یک هایپ است که بعد از دو سه سال کنار می‌رود و دوباره همان مدل روزنامه و تلویزیون باقی می‌ماند. اما دیدیم که واقعاً اینترنت چیزی بود که هایپ شد، هنوز هم هست و در آینده هم خواهد بود. به نظر من هوش مصنوعی چیزی است که واقعاً می‌شود روی آن سرمایه‌گذاری کرد.مثلاً  کشورهایی مانند امارات و قطر در حال ایجاد وزارتخانه هوش مصنوعی هستند، در حالی که این اتفاق برای چیزی مثل متاورس یا بلاک‌چین نیفتاده است.

متاورس، بلاک‌چین و حتی شبکه‌های اجتماعی که می‌بینیم، همه زیرمجموعه اینترنت هستند. اما به نظر می‌رسد هوش مصنوعی چیزی است که قرار است فراتر از آن برود و به تدریج جای انسان هوشمند را تا شاید 40 یا 50 سال آینده در بسیاری از کارها بگیرد.

پوریا حداد: پس اگر بخواهیم یک نگاه به آینده هوش مصنوعی داشته باشیم، شما چطور آن را می‌بینید؟

دکتر کاویانی: به نظر من، هوش مصنوعی یک تکنولوژی پیشرو است که بعضی از تکنولوژی‌های دیگر مانند بلاک‌چین و خیلی چیزهای دیگر دارند از مزایای آن استفاده می‌کنند و با آن ترکیب می‌شوند. تأثیر آن روی آینده 40 یا 50 سال دیگر بر انسان‌ها چشمگیر خواهد بود.

فکر می‌کنم ما وارد دنیای جدیدی می‌شویم. همه ما دوران کودکی خود را به یاد داریم که تنها راه ارتباطی ما با دیگران یا به صورت حضوری بود یا نهایتاً تلفنی، که آن هم محدودیت‌های خاص خودش را داشت. اما وقتی گوشی‌های هوشمند و اینترنت آمدند، دیدیم که در این 20 سال، کل سبک زندگی ما عوض شد.

اینترنت، شبکه‌های اجتماعی و گوشی‌های هوشمند همه تبدیل به یک سبک زندگی جدید شدند و در واقع یک تمدن جدید را پایه‌گذاری کردند. اگر بخواهیم مقایسه کنیم، انسان‌ها در 4000 سال قبل تقریباً یک طور زندگی می‌کردند، اما در این 20 سال اخیر، تغییرات به قدری زیاد بوده که شاید به اندازه آن 4000 سال، سبک زندگی‌ها عوض شده است.

آنچه که من در حال حاضر احساس می‌کنم و مقالاتی که منتشر می‌شوند نشان می‌دهند، این است که احتمالاً تا 40 یا 50 سال آینده، ما شاهد یک تغییر پارادایم اساسی خواهیم بود. شاید ما دیگر دانشمندان را به شکل امروزی نداشته باشیم. افرادی مانند مریم میرزاخانی ممکن است آخرین نسل از دانشمندان انسانی باشند.

پوریا حداد: این پیش‌بینی بسیار جالب توجه است. می‌توانید بیشتر توضیح دهید؟

دکتر کاویانی: بله، به نظر می‌رسد که دانشمندان آینده، الگوریتم‌هایی خواهند بود که می‌توانند فکر کنند، مسائل ریاضی را حل کنند و از نتایج خود استفاده کنند. در واقع، ما دیگر دانشمند، مقاله‌نویس یا استاد دانشگاه به شکل سنتی نخواهیم داشت، زیرا سیستم‌هایی مانند ChatGPT این وظایف را انجام خواهند داد. وقتی این مشاغل از بین بروند، ارزش‌ها تغییر می‌کنند و به تبع آن، سبک زندگی نیز دگرگون می‌شود و در نهایت، به نظر من، یک تمدن جدید شکل می‌گیرد.

پوریا حداد: این دیدگاه بسیار عمیق و تأمل‌برانگیز است. آیا فکر می‌کنید عوامل دیگری نیز در این تحول نقش خواهند داشت؟

دکتر کاویانی: بله، به نظر من موضوع اصلی زمانی آغاز می‌شود که ما بتوانیم از توانایی کامپیوترهای کوانتومی استفاده کنیم. کامپیوترهای کوانتومی که امروزه درباره‌شان صحبت می‌کنیم، قادر خواهند بود فرآیندهایی را که شاید چند دهه برای ابرکامپیوترهای امروزی طول بکشد، در عرض چند ثانیه انجام دهند.این پیشرفت در قدرت محاسباتی می‌تواند تأثیرات شگرفی داشته باشد.

زمانی که قدرت پردازش ما به این حد برسد، احتمالاً ترکیب آن با مدل‌های فعلی و داده‌های عظیمی که جمع‌آوری شده‌اند، رویدادی را رقم خواهد زد که ما واقعاً یک تغییر پارادایم بزرگ را تجربه خواهیم کرد. ما به سمتی می‌رویم که تمام اصول، حتی اصول تکنولوژی که امروز داریم، تغییر خواهند کرد.

پوریا حداد: می‌توانید مثالی از این تغییرات بزنید؟

دکتر کاویانی: بله، مثلاً در حوزه رمزنگاری، ما امروز اصول خاصی داریم. برای مثال، برای انتخاب یک رمز قوی، توصیه‌هایی مانند استفاده از کاراکترهای خاص داریم. یا در مورد بیت‌کوین، حل معادلات خاصی لازم است. اما وقتی قدرت پردازش ما به حدی برسد که همه این‌ها در کسری از ثانیه حل شوند، کل این نظام تغییر خواهد کرد.

پوریا حداد: این تغییرات چه تأثیری بر زندگی روزمره مردم خواهد داشت؟

دکتر کاویانی: پس از این تحولات، همان‌طور که شما اشاره کردید، ارزش‌های انسان‌ها تغییر خواهد کرد. احتمالاً برای بسیاری از افراد، کار کردن به شیوه سنتی دیگر یک ارزش نخواهد بود. مثلاً اینکه از ساعت 8 صبح تا 5 بعدازظهر سر کار بروند. احتمالاً مردم به سمت پیگیری سرگرمی‌های جدید یا پیشرفت در بخش‌های دیگری از فعالیت‌هایشان خواهند رفت.

پوریا حداد: آیا این تغییرات می‌تواند تأثیرات منفی هم داشته باشد؟

دکتر کاویانی: البته، ممکن است تأثیرات منفی هم وجود داشته باشد. ما هنوز آن دنیا را تجربه نکرده‌ایم، اما شاید کار نکردن افراد تأثیرات منفی بر سلامت جسمی، روحی یا جنبه‌های دیگر زندگی داشته باشد. 

اگر یک انسان 100 سال پیش را تصور کنید، مثلاً در زمان قاجار، اگر به او می‌گفتید که “من چیزی دارم که خیلی به آن می‌نازم، یک اکانت در اینستاگرام با 500 هزار فالوور”، اول اینکه اصلاً نمی‌فهمید چه می‌گویید و اگر هم می‌فهمید، احتمالاً فکر می‌کرد شما دیوانه هستید، چون این مفهوم با فضای فکری آن زمان سازگار نبود.احتمالاً همین اتفاق 50 سال آینده هم می‌افتد. یک سری چیزها ارزشمند می‌شوند که ما الان نمی‌دانیم چه هستند. شاید اگر کسی بگوید روی موضوع خاصی کار می‌کند، ما الان به آن بخندیم، ولی 50 سال دیگر این موضوع کاملاً ارزشمند شود و شاید خیلی از تمدن‌ها حول آن شکل بگیرند.

پوریا حداد: پس شما معتقدید که ارزش‌های فعلی ما ممکن است در آینده کاملاً تغییر کنند؟

دکتر کاویانی: بله، احتمال بسیار قوی، شاید بالای 90 درصد، وجود دارد که تا 50 سال آینده خیلی از چیزهایی که ما الان به عنوان ارزش قبول داریم، دیگر ارزش نباشند. مثلاً الان شغل شخص، سمت سازمانی‌اش، اینکه استاد دانشگاه است، چند مقاله منتشر کرده یا چند مسئله ریاضی را حل کرده، همه اینها ارزش محسوب می‌شوند. اما احتمالاً تا 50 سال دیگر هیچ کدام از اینها ارزش نخواهند بود.

پوریا حداد: این تغییرات می‌تواند حتی به دارایی‌های ما هم تسری پیدا کند؟

دکتر کاویانی: بله، حتی ممکن است دارایی‌هایمان هم تغییر کنند. مثلاً اگر متاورس راه بیفتد، شاید دارایی‌هایی که در دنیای دیجیتال داریم ارزش بیشتری از دارایی‌های فیزیکی داشته باشند. مثلاً زمانی آلومینیوم بسیار ارزشمند بود. هر کس یک قاشق آلومینیومی داشت، در زمان خودش بسیار ثروتمند محسوب می‌شد. در حالی که امروزه ما آلومینیوم را کنار جاده می‌اندازیم و هیچ اتفاقی هم نمی‌افتد. احتمال زیاد همین اتفاقات در مورد ارزش‌های امروزی ما هم خواهد افتاد.

تنها کاری که ما می‌توانیم بکنیم این است که منتظر بمانیم و اگر زنده ماندیم، این روزها را ببینیم. اگر نه، باید ببینیم نسل بعد چه کاری می‌خواهد انجام دهد.

پوریا حداد: بسیار عالی. از شما بسیار متشکرم. این گفتگو بسیار ارزشمند و آموزنده بود. من شخصاً بسیار از آن بهره بردم و خوشحالم که این فرصت را داشتیم. امیدوارم برای برنامه‌های بعدی هم این همراهی را با ما داشته باشید.



نظرات

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

درباره این قسمت:

گفتگوهای مشابه:

پادکست مداد زرد