گفتگو میثم علیزاده با 100 استارتاپ در حاشیه رویداد هوش مصنوعی
امروزه استفاده از اینترنت و شبکههای اجتماعی افزایش پیدا کرده و دادههای رفتاری و اجتماعی فراوانی برای محققین به وجود آورده است. صرف وجود داده به خودی خود نمیتواند در علوم اجتماعی و سیاستگذاری تاثیری داشته باشد. با توجه به اینکه این رشته به تازگی در دنیا اضافه شده و در ایران هم این رشته وجود ندارد ضعفهایی در کشور وجود دارد. شرکت مفید تحلیل داده (متدیتا) با تیمی خبره این نیاز را در کشور برطرف کرده و گامهایی را برای ارتقا در استفاده درست از داده برداشته است.
رشته علوم اجتماعی محاسباتی چیست؟
رشته علوم اجتماعی محاسباتی در واقع ترکیبی از علوم کامپیوتر، علوم اجتماعی و آمار است. به زبان ساده این رشته، تکنیکهای علوم کامپیوتر و دادههای دیجیتال جدید را با تئوریهای علوم اجتماعی تطبیق داده، رد یا اثبات میکند یا تئوریهای جدیدی را به وجود آورد. لذا با تحلیل ساده دادههای شبکه اجتماعی فرق دارد. رشته علوم اجتماعی محاسباتی به صورت آکادمیک و منسجم در ایران وجود ندارد.
قبلا کسی میگفت که من با استفاده از هوش مصنوعی دادههای توییتر را تحلیل کردم دیگران تحسین میکردند اما الان همه سوال میکنند که: دادههای کجاست؟ دادهها برای چه مدت هستند؟ اکانتهای پرایوت را چه کردی؟ و… . یک مقدار بازار با ثباتتر شده و سوالهای جدیدی مطرح شده است. به طور مثال قبلا بازار در حوزه دیجیتال مارکتینگ، فردی را میخواست که کمپینی راه اندازی کند اما حالا کسبوکارهای بزرگ میگویند که شما کمپینی را برای من اجرا کردی، چه اثری داشت؟ اگر کمپین اجرا نمیشد فالورهای من چقدر بود؟ اگر این کمپین اجرا نمیشد فروش چه میزان بود؟ اگر با شرکت دیگری همکاری میکردم چقدر تفاوت وجود داشت؟ بعضی از شرکتها اصلا جواب این سوالات را ندارند که به ضعف آکادمیک کشور بر میگردد.
دادههای پلتفرمهای داخلی چقدر استفاده میشود؟
ما مشتاق هستیم که به دادههای داخلی دسترسی داشته باشیم و حول همین دادهها کسبوکار شکل بگیرد اما مستلزم این است که مردم به صورت طبیعی و بدون اجبار از پلتفرمهای داخلی استفاده کنند. مثلا در همین انتخابات اخیر، ما پیشنهاد دادیم که نمایندگان صرفا در پلتفرمهای خارجی سرمایه گذاری نکنند و از شبکههای داخلی استفاده شود. اگر مردم به صورت ارگانیک در پلتفرمهای داخلی فعالیت کنند، دادهها ارزشمندتر شده و اکوسیستمی شکل میگیرد. با زیاد شدن دادهها دعواهای حقوقی نیز شروع میشود. الان امریکا و اروپا نیز با پلتفرمها دعوا دارند و دادههایی که محققین نیاز دارند را ارائه نمیدهند.
چالشهای متخصصین هوش مصنوعی
متخصصین فعال در زمینه هوش مصنوعی به دلایلی با مشکلاتی روبرو هستند که با دو نکته تا حدودی برطرف میشود:
نکته اول: یکسری سوالها را میشود جواب داد و یکسریها را نمیشود. به متخصصی که میگوید جواب هر سوالی را میدهد باید شک کرد. یکی از چیزهایی که متخصص باید بداند و با شجاعت به کارفرما بگوید، سوالهایی است که نمیتوان پاسخ داد. جواب ندادن به خاطر این است که داده خوبی نداریم یا روش خوبی برای رسیدن به داده وجود ندارد.
نکته دوم: تحقیق جامعی بر روی روشهای جمع آوری دادههای شبکه اجتماعی در کشور انجام دهیم. مشاهده کنیم روش ابتکاری شرکتها در جمعآوری دادهها چیست. به طور مثال شرکتها چطور از توییتر داده میگیرند یا مثلا اینستاگرام چه بخشی از دادهها را به ما میدهد. اگر کسی فالوورهای اکانتی که 10-20 هزار فالوور دارد را بخواهد داده همه فالوورها را دریافت میکند. اگر اکانتی 1 میلیون فالوور داشته باشد نهایتا دادهی 100 هزار نفر را میگیرد. این 100 هزار داده به چه صورت است:
1 – رندوم |
2 _ 100هزار فالوور اول |
3 – 100هزار فالوور آخر |
4 – 100هزار فالوور با بیشترین تعامل |
مقاومت پلتفرمها در آزادسازی دادهها
چندین سال است که گروههای دانشگاهی، خبرنگاری، رسانهای و … از پلتفرمهای بزرگ مثل توییتر، گوگل و فیسبوک انتقاد میکنند؛ اگر پلتفرمهای بزرگ دادهها را در اختیار مردم قرار دهند استارتاپهای زیادی شکل میگیرند. این استارتاپها شغلهای زیادی ایجاد کرده و زندگی مردم را راحتتر میکنند.
در آمریکا تمام دادههای مالی اعم از کارت کشیدن و قسط دادن، در 3 شرکت عظیم جمع میشود. الان اگر کد ملی من را وارد کنید این شرکتها سیر تا پیاز حساب مالی من را دارند. چه تاریخی پول به حساب آمده؟ چه تاریخی کارت کشیدم؟ چه چیزی خریدم؟ از کجا خریدم؟ ماهانه چقدر قسط پرداخت میکنم؟ خوش حساب بودم یا نبودم؟ و… . استارتاپهای زیادی حول این ماجرا شکل گرفتهاند. استارتاپ از این دادهها استفاده کرده و خدماتی به مردم یا بانکها ارائه میدهند.
قانون درست و حسابی وجود ندارد حتی اتحادیه اروپا که قانون نوشته، مسائل فنی را در نظر نگرفته است. وقتی حقوقدان قوانین را مینویسند مسئولهای فنی میگویند که قانون شیکی است اما اجرایش بسیار دشوار میباشد. افکار عمومی هم به این سمت نرفته و تا زمانی که افکار عمومی به این سمت نرود قانونگذارها نمیتوانند به پلتفرمها فشار بیاورند. دلیل دیگر اینکه تیم درست و حسابی که متشکل از حقوقدان و افراد فنی باشد شکل نگرفته است.
رگولاتوری در مقابل پلتفرمها
رگولاتور یا قانونگذارها پلتفرمها را به فیلترینگ تهدید میکنند برای اینکه دادهها را در اختیار مردم قرار دهند. بسیاری از کشورهای اروپایی جریمه سنگینی برای پلتفرمها میگذارند و به باطل کردن مجوز تهدید میکنند. کشور ما متاسفانه تحریم است و زورش به تهدید نمیرسد. کشورهایی که مشکلات سیاسی ما را ندارند به راحتی از این اهرمها استفاده کرده و پلتفرمها را سر میز مذاکره میآورند. تیم قانونگذار اگر اشراف فنی داشته باشد میتواند بگوید چیزی که من گفتم قابل جمعآوری است و پلتفرم کم کاری کرده پس باید جریمه شود.
این زور از رسانه و اقتصاد قوی کشور میآید. به طور مثال کشوری که تعداد اکانت بالایی دارد با تهدید و تحریم، بخشی از پلتفرم تحت شعاع قرار میگیرد. مسئله دیگر اینکه همکاری برای پلتفرم هزینه سیاسی و اجتماعی نداشته باشد. ما توییتر را فیلتر کردیم و توییتر نمیتواند به صورت آشکار با ما مذاکره کند حتی اگر توافقی شود، علنی نمیکند. اگر توییتر بگوید که با ما به توافق رسیده 16 گروه حقوق بشری ایراد میگیرند که چرا با کشوری توافق کردی که مردمش را فیلتر کرده است.
مشکلات ایران در هوش مصنوعی چیست؟
در ایران به لحاظ فنی یعنی آن قسمت ریاضی و کد زنی مشکلی نداریم. چه مشکلاتی داریم؟
مشکل اول: داده است، وقتی دادهای نباشد نمیتوانیم از هوش مصنوعی استفاده کنیم. هنوز برای بعضی از مسئولین و شرکتها اهمیت داده روشن نیست. در خارج یکسری پروژهها تعریف میشود که خروجی آن پایگاه داده(Database) و مرکز داده(Data Center) است. به طور مثال مرکز دادهای حاوی فیلمهای رکیک است و این اهمیت بالایی دارد. حالا اگر کسی همچین دادهای در ایران تعریف کند میگویند که داده خالی که به درد نمیخورد، تحلیلی کنید چیزی در آورید. هنوز اهمیت خود داده را متوجه نشدهاند.
مشکل دوم: کاربردی کردن هوش مصنوعی به خودی خود تخصص است. الان در ایران سطح اساتید داخل کشور به لحاظ اشراف بر تکنیکهای جدید و قسمت ریاضی هوش مصنوعی بالا است. اما در این حوزه که از تکنیکهای هوش مصنوعی در مسئله اجتماعی، سیاست گذاری و کسبوکاری استفاده کنیم ضعیف هستیم. همینطور روی اینکه چگونه خروجیهای هوش مصنوعی را به زبان قابل فهم برای سیاست گذار ارائه دهیم ضعیف هستیم.
توصیه به دولت آینده
معاونت فناوری و علمی ارتباط خوبی را با افراد تحصیل کرده در خارج مثل من برقرار کرده است. معاونت علمی فناوری به افرادی مثل من در برگزاری سمینار علمی، سربازی و … کمکهایی میکند. منتها مثل هر سیستم دیگری که در کشور راه میافتد طبیعتا خالی از اشکال نیست. بعضی از ادعاهایی که مطرح میشود با عملکرد متفاوت است. به طور مثال کارهای اداری به خوبی پیش میرود اما زمان پرداخت، میگویند که دست ما نیست. الان حول اکوسیستم استارتاپی کشور، اکوسیستمی برای دلالها شکل گرفته است. به استارتاپی میگویند که میتوانم برای مجموعه وامی را بگیرم به ازای 5 درصد از سهام استارتاپ. خب این دلالی خیلی بد است، اگر بودجهای وجود دارد، مرکزی برای اعطای وام در نظر گرفته شود.
ما صرفا با وزیر ارتباطات کار نداریم بلکه با هر وزارت خانهای که دادهای داشته باشد کار داریم. زمانی سازمانها و وزارتخانههای نمیدانستند داده چیست و چقدر مهم است اما الان به آن نقطه رسیدهاند که داده مهم است. به همین خاطر دادهها را به هیچکس نمیدهند. باید یک مقدار بحث آزاد سازی داده را به صورت ریشهای حل کنیم.
اوباما در دوره دوم ریاست جمهوری، معاونتی به اسم علم داده Data Science راه اندازی کرد و مدیرعامل سابق گوگل مسئول این بخش شد. فردی را مسئول کرد که علم داده، هوش مصنوعی و تحلیل شبکه میداند و با اکوسیستم استارتاپی و استفاده بیزینسی از دادهها آشناست و اشراف به کشور و دادههای مختلف کشور دارد. کار این شخص این است که بفهمد مشکلات کشور را با چه دادههایی میتوان حل کرد. برای حل مسائل کشور دادههای کدام سازمانها ترکیب شود و چگونه این دادهها اشتراک گذاری شوند. الان من نمیدانم که در ایران سازمانی این وظیفه را دارد یا نه. اگر معاونت یا سازمانی در کشور که در این زمینه قدمهایی برداشته تقویت شده و یکسری بودجهها برایشان تعریف شود.
دوراهی کارمندی در دولت یا فیسبوک
در حوزه تکنولوژی نمیتوان با حقوق کم کارمندی، دولت فناور یا دولت دانش بنیان شد. الان در آمریکا هم بحث رگولاتوری مطرح است. کسی که فارغ التحصیل میشود دو گزینه دارد؛ دولت یا فیس بوک، که فیس بوک دو برابر دولت حقوق پرداخت میکند. در آمریکا همین موضوع مطرح است که سطح حقوقی که دولت میپردازد بسیار غیر جذاب است مخصوصا برای طراحان وب و متخصص علم داده.
در ایران سازمانهایی داریم که معاف از سیستم حقوقی مصوب دولت هستند و اجازه دارند که حقوق بیشتری پرداخت کنند. به نظرم در حوزه داده باید معاونتی با بودجهی مشخص و افراد قوی تشکیل شود تا بتوانیم در این حوزهها حرفی برای گفتن داشته باشیم.
چالش هوش مصنوعی و اخلاق
راجع به مسائل اخلاقی هوش مصنوعی چقدر باید حساس بود؟ همین اعتبار سنجی مشتری (Credit Scoring) که در حالا باب شدن است، یکی از چالشهای اصلی اعتبار سنجی این است که میتواند باعث فقیرتر شدن فقرا شود. اعتبار سنجی به دیگران نشان میدهد که یک فرد چقدر خوش حساب است تا وام بگیرد و به فرد بد حساب وامی ندهند. فرد خوش حساب با نرخ بهره پایین وام بگیرد و فرد بد حساب با نرخ بهره بالایی وام دریافت کند. این یک مسئله اخلاقی است در حوزه عدالت مطرح میشود.
الان در کاربرد هوش مصنوعی بحث عدالت، شفافیت و قابل تفسیر بودن مطرح است. اگر قرار بر این باشد که هوش مصنوعی ساخته شود که عکس گربه از سگ را تشخیص دهد مهم نیست که از چه تکنیکی استفاده کنیم همین که با درصد بالایی تشخیص دهد رضایت بخش است. اما زمانی هوش مصنوعی برای وزارت رفاه ساخته میشود که تشخیص دهد فردی یارانه بگیرد یا خیر مسئله اخلاق و عدالت مطرح میشود. به طور مثال کسی اعتراض میکند که چرا یارانه من را قطع کردهاید؟ شما نمیتوانید بگویید که ما سیستمی را داریم که مبتنی بر یادگیری عمیق است و طبق آن مدل شما نباید یارانه دریافت کنید. برای این کاربرد، باید مدلی را بالا بیآورید که خروجی آن برای انسان قابل فهم بوده و مبتنی بر عدالت باشد.
شفافیت در هوش مصنوعی فقط در حد سخنرانی است. بعضی از استارتاپهایی که وضع خوبی دارند از خارج چند نفر دعوت میکنند یا دانشجوی دکتری مقاله ارائه میدهد. خارج از کشور به صورت جدی روی این مسائل کار میشود و تکنولوژیهایی به دست آمده است.
دانشگاه در کاربردی کردن علوم ضعیف است!
من این را همیشه میگویم که دانشگاه ما در کاربردی کردن هر چیزی به غیر از علوم پزشکی و هنر ضعیف است. زمانی که دانشگاه بودیم میگفتند ارتباط با صنعت در دانشگاه مشکل دارد و توپ را به زمین صنعت میانداختند. در حوزه کاری خودم که تحصیل کردهام و شرکت دارم، چیزی که میبینم کاملا برعکس است. مدیرعامل بخش صنعت خصوصی یا دولتی عقلش میرسد که سراغ متخصص برود اما متخصص حرفی برای گفتن ندارد. یا یک متخصص کاری که نمیتوان انجام داد را ضعیف تحویل میدهد و همین کار ضعیف تا 20 سال برای شرکتهای قوی در این حوزه چالش ایجاد میکند و اعتماد را از بین میبرد.
مشکل اساسی ما نیروی انسانی متخصص است که همه متخصصهای هوش مصنوعی در حال خروج از کشور هستند. زمان راهاندازی شرکت با مدیرعامل یک vc صحبت کردم به من گفت که فکر میکنی بزرگترین چالش چه باشد؟ من گفتم که از این میترسم که کسی حرفم را نفهمد یا نتوانم کار بگیرم یا به خاطر دانشگاههایی که بودم اذیتم کنند. مدیرعامل vc گفت که هیچ کدام از این مواردی که گفتی اتفاق نمیافتد. اولین موردی که اذیت میکند نیروی انسانی متخصص است. برای کسبوکارهایی معلومی مثل حوزه بشقاب و لیوان و … در پیدا کردن نیروی انسانی متخصص ضعف داریم چه برسد به حوزه هوش مصنوعی که تماما کار تخصصی است.
درصد قابل توجهای از بچههای خوب کامیپوتر از کشور خارج میشوند. درصد قابل توجهی هم در حال جمع آوری پول هستند که بروند. امید ما این بود که در بازه جمع آوری پول، همکاری کنیم که در این بازه نیز فریلنسری با کشورهای معتبر خارجی کار میکنند. این خبری که امارات میخواهد 1000 استارتاپ راه اندازی کند و 100 هزار متخصص وب آموزش دهد، راست است. اوضاع بدتر هم شده یعنی عدهای که رفتهاند عدهای هم فریلنسری با شرکتهای معتبر خارجی یا با چند شرکت بزرگ ایران کار میکنند که حقوقهای بالایی میپردازند. حالا امارات را هم اضافه کنید که بیخ گوش ماست و 100 هزار نفر جذب می کند.
توصیه میثم علی زاده به افرادی که میخواهند در حوزه فناوری و استارتاپ فعالیت کنند:
- به حرف با تجربهها گوش کنید.
- تیم را خیلی جدی بگیرد، تیم از هر چیزی مهمتر است.
- اعتماد به نفس داشته باشید نسبت به کاری که انجام میدهید که هر چیزی که با تجربهها گفتند را قبول نکنید.