کاربردهای وسیع علم داده
تاریخ انتشار:۱۳:۴۲ ۱۳۹۸/۷/۱۲

کاربردهای وسیع علم داده


بخش کوچکی از کاربردهای وسیع علم داده

یکی از سوالاتی که هر شخصی در ابتدای فراگیری هر علمی از خود می‌پرسد این است که "آنچه ‌‌می‌آموزم چه کاربردی دارد و شغل من در آینده چه خواهد بود؟". در این بخش برآنیم تا طیف گسترده‌ای از موارد استفاده‌ی علم داده را بیان کنیم. شایان ذکر است که کاربرد‌‌های علم داده به قدری وسیع است که اکثر کارفرمایان و مالکین کسب و کار اطلاعی از اثرگذاری و منفعت این علم در کسب کار خودشان ندارند. و برخی حتی از چیستی علم داده آگاهی ندارند. پس یکی از وظایف دانشمند علم داده ارائه‌ی مستندات و راه حل‌‌های ملموس برای کارفرمایان و در نتیجه قانع کردن ‌‌آن‌هاست.




شاخه فروش:


– تحلیل احساس مشتری:


تحلیل احساس "Sentiment Analysis" مبحثی بسیار گسترده است و امروزه در تحلیل اجتماع، پیشبینی وقایع و تحلیل‌‌های پیچیده اجتماعی و سیاسی و پیش بینی ‌‌آن‌ها نقش مهمی ایفا می‌کند.

این مبحث یک باب نوین در علم نیست و سال‌هاست که درحال اجراست. اما با آمدن علم داده این کار با دقت بسیار زیاد‌تر و در زمان کمتری انجام پذیر است. این بدین معنی است که دیگر نیازی به لیست‌‌های نظر سنجی بلند بالا نیست که تقریبا هیچگاه به نتیجه صحیح و بازخورد قابل استناد نمی‌رسد؛ چرا که مشتریان علاقه به هزینه کردن زمان خود برای دادن بازخوردهای بلند بالا ندارند و اگر ‌‌آن‌ها را با روش‌‌های گوناگون و غیر مستقیم مجبور به پاسخ دادن به سوالات کنیم، از دستشان می‌دهیم. امروزه این کار با تحلیل کامنت‌‌ها و لایک‌‌های مشتریان در فضای مجازی یا در محل‌‌هایی که برای "انتقاد و پیشنهاد انتخابی" در نظر گرفته شده ممکن است.


– کنترل بهینه موجودی یا انبار:


صاحبان کسب و کار همیشه به دنبال تامین محصول و یا اقلام مناسب، در زمان مناسب، با کیفیت مناسب و قیمت معقول هستند. داشن قیمت تمام شده معقول به عوامل زیادی بستگی دارد. بخشی از آن به زمان و مقدار خرید باز می‌گردد و بخشی دیگر به پیشبینی تلاطم بازار و پیشبینی نیاز مشتریان در آینده. زمانی که حرف از پیشبینی، کشف، تشخیص و یا بهینه سازی بر اساس چندین پارامتر و قوانین پیچیده به میان ‌‌می‌آید، علم داده از اولین ابزارهای کاربردی و راه بهینه برون رفت از سردرگمی و تصمیمات اشتباه است.

به این منظور فرآیندهای زنجیره‌ی تامین و وقایع آن در کنار تجربیات و ذکاوت، منابع اصلی جمع آوری داده‌های ما هستند. سپس روش‌‌های آماری و الگوریتم‌های مناسب برای یادگیری ماشین و همچنین رصد بازار و تغییرات آن ما را در یافتن راه حل‌‌های مناسب در این مسئله یاری می‌دهد.


– بهینه سازی قیمت:


قطعا برای یکایک ما پیش آمده که از خریدی به علت قیمت "نامتناسب" آن منصرف شده باشیم. بر اساس آمار موجود جهانی، سیاست قیمت‌گذاری به علت پیچیده بودن و تعدد پارامترهای دخیل عمدتا به شکل ناقص تشخیص داده و وضع می‌شوند. این موضوع یکی از دلایل اصلی کم شدن سود سالانه معرفی شده است. گاهی یا بهتر است بگوییم در اکثر مواقع به علت نامعقول بودن و بالا بودن قیمت و در برخی دیگر از موارد به علت عدم سنخیت قیمت پایین و یا بالای کالا با سطح کیفی‌‌ مورد انتظار، مشتری از خرید کالا منصرف می‌شود و به دنبال کالای جایگزین می‌رود. این دیدگاه از سمت خریدار، درکنار دیدگاه فروشنده که به دنبال افزایش مشتری و در عین حال حفظ سود است، چالشی جالب و رایج است.

پارامترها و شاخص‌‌های گوناگونی در این مسئله دخیل اند و رسیدن به یک راه حل که بر حسب رویدادها و فصول مختلف، بهترین حالت فروش و رونق کسب را به همراه داشته باشد، نیازمند تحلیل‌‌های گوناگون است. رفتار خریدار، زمان خرید، قیمت خرید اجناس از سمت فروشنده، شرایط بازار، رقابت، بحران‌ها و موارد متعدد دیگر در رسیدن به یک سلسله¬ی صحیح از تصمیمات و مجموعه‌‌ای منعطف و قابل تطبیق از پارامترها و شاخص‌‌ها، نیازمند مجهز بودن به علم داده است. این علم به ما امکانات حفظ مشتری با کمترین هزینه را می‌دهد.


تشخیص محل جغرافیایی کسب و کار:


  • آیا می‌دانید مقدار سود از دست رفته به علت اشتباه انتخاب در مکان کسب و کار شما چقدر است؟
  • چقدر از این سود از دست رفته به علت عدم وجود مشتریان مورد نظر شما در نزدیکی محل کسب شماست؟
  • چه مقدار ازین سود از دست رفته به علت فاصله‌ی شما از مناطق اصلی ارائه‌ی کالای مورد نظر شماست؟
  • چه مقدار از سود ازدست رفته به علت شلوغی بیش از حد و نبود جای پارک در محل فعلی کسب و کار شماست؟


علم داده با توجه به انتخاب و نحوه تصمیم گیری مالکان کسب و کارهای مبتنی بر حضور مراجعین، بهترین راه تشخیص محل خرید و یا ساخت شعب شناخته شده است. با یک دید فنی جهت تشخیص بهترین محل جغرافیایی، داده‌‌های فراوانی برای تحلیل و پردازش به نظر خواهد آمد.
راه حل این تشخیص، ساده اما بسیار موثر است. با مطالعه داده‌های به‌روز مشتریان، اطلاعات سرشماری و فراوانی تعداد اشخاص در هر محله با درنظر گرفتن ساعات حضور افراد و نوع مشغله‌ی ‌‌آن‌ها می‌توان به محل جغرافیایی‌‌ مناسبی که بیشترین پتانسیل را برای نوع کسب و کار مد نظرمان دارد، دست یافت. در نظر گرفتن موقعیت مکانی کسب و کارها با استفاده از داده‌های موجود، کارفرما را از سرمایه‌گذاری اشتباه دور کرده و ایشان را به سمت بهینه‌ترین انتخاب محل سوق خواهد داد.


– تحلیل تخلف در درخواست خدمات پس از فروش:


می‌دانیم که خدمات پس از فروش، برای فردی که ضمانت می‌دهد کم و یا بی هزینه نیست و بدیهی است که تخلفاتی در این زمینه به فراخور بعضی پارامترها از جمله ارزش کالا شکل می‌گیرد. کشف این گونه تخلفات و تحلیل کلیه‌ی درخواست‌های دریافت خدمات پس از فروش می‌تواند راهی برای بهینه‌سازی در زمان، هزینه، شهرت خدمات دهنده و دیگر موارد باشد.

این دست از تحلیل و تشخیص‌ها خیلی ساده شکل نمی‌گیرد و شامل مراحل نسبتا پیچیده مثل دسته بندی مشتری، تحلیل صحت دسته بندی، کاهش آلارم های اشتباه "False Positive"، تقویت خصیصه‌های ممیزی، ذکاوت و آگاهی فرایندی و غیره می¬شود. همچنین از بعد فنی نیز پردازش متن، داده کاوی کلاسیک و آمار و احتمالات نیازمندی‌های این گونه پروژه‌ها هستند.

این روش الزاما مختص کالاهای گران قیمت و یا با تعمیرات پر هزینه نیستند. چرا که هزینه پاسخگویی، رسیدگی به درخواست‌ها، حمل و نقل و برطرف کردن مشکل احتمالی هر کالایی بخش زیادی از هزینه¬ی کسب و کارها بوده و برای کارفرمایان قابل توجه است. با استفاده از علم داده می‌توان هزینه‌های رسیدگی به درخواست‌ها را معطوف به درخواست های مشکوک کرد و با توجه به شرایط، آن‌ها را رد و یا مرتفع کرد.


– تحلیل سبد خرید:


تحلیل سبد خرید از سنتی‌ترین و ساده‌ترین مباحثی است که با علم داده بهینه شده است و شامل یادگیری از طریق روش‌هایی از جمله کشف رشته قوانین "Rule Mining" به انجام می‌رسد. در این شاخه، علاقه‌مندی و عدم علاقه‌مندی و مجموعه‌ای از محصولاتی که بیشترین احتمال خریداری شدن را دارند قابل استخراج است. توابع وابستگی و قوانین انجمنی، عضوهای اصلی ساخت و یا کشف قوانین در این مسئله هستند. تولید محصولات در صورت وجود داده‌ی لازم در این گونه تحلیل‌ها ممکن و شدنی است.

یکی از نکات چالشی در این گونه مسائل که عموما نادیده گرفته می-شود نحوه‌ی سنجش نتایج نهایی قبل از ارائه به کارفرماست. چرا که توابع سنجشی در اینگونه مسائل رفتار عجیبی دارند و ممکن است ما را به اشتباه ساده با تبعات بسیار بزرگ مبتلا کنند. دقت داشته باشیم که در تحلیل سبد خرید، اشتباهات ما به عنوان دانشمند داده می‌تواند در مدت زمان کوتاهی آثار سوء خود را نشان دهند و سود نهایی کارفرما را کاهش دهند. بنابراین پیشنهاد می‌گردد علم لازم در این زمینه را پیش از انجام پروژه‌ی کلان کسب کنید.


– سیستم‌های پیشنهاد دهنده:


چه چیزی را به چه اشخاصی پیشنهاد دهیم یا چگونه تبلیغات را کمتر و در همان حال موثرتر کنیم؟ این سوال اصلی مدیران تبلیغاتی و مالکان کسب و کار است.

بهترین پیشنهاد، موثرترین تبلیغات، یافتن نیازمندی قطعی و یا احتمالی مشتری بر اساس رفتار مشتری، گروه‌بندی مشتریان بر اساس نیاز آن‌ها، سلایق مشتریان و مواردی ازین دست تماما از اهداف بهینه سازان تمامی کسب و کارهاست. چنانچه بتوان موارد مذکور را تا حد معقولی شناسایی کرد، می‌توان موتورهای پیشنهاد دهنده‌ای تولید کرد تا با در نظرگرفتن این داده‌ها و الگوریتم‌های مناسب بهترین پیشنهاد را به مشتری ارائه کند.
به مجموعه اقدامات فوق که درحال حاضر بازار گرمی دارد، سیستم‌های پیشنهاد دهنده گفته می‌شود. اجرای این سیستم به دو شکل فیلترینگ با همکاری و فیلترینگ براساس محتوا انجام می‌شود. فیلترینگ بر اساس همکاری مبتنی بر شباهت سلیقه و شباهت رفتار مشتریان به یکدیگر است و فیلترینگ براساس محتوا مبتنی بر پیشینه و سلایق خود مشتری است.



شاخه رسانه:


– Customer Churn یا نگهداری مشتری:


دو مبحث اصلی در گسترش هر کسب و کاری اهمیت زیادی دارد؛ جذب مشتری و نگهداری آن. موضوعاتی که هردو هزینه‌بر هستند. در کنار این مباحث، متخصصین گسترش و بهبود کسب و کار به دنبال یافتن چگونگی اجرای این دو هستند و در مرحله بعد به دنبال بهینه کردن آن‌ها.
بر اساس تجریبات و مدیریت دانش صورت گرفته توسط دانشمندان علوم داده، اولین شاخه‌ی دسته‌بندی مشتری "Customer Segmentation" تشخیص جدید و یا قدیمی بودن مشتری است؛ در صورت جدید بودن مشتری ما زمان محدودی برای جذب بازدید کننده‌ی جدید وب سایت، کانال و یا محصول داریم. بنابراین باید براساس همان اطلاعات محدود اولیه¬ی مشتری، چه به صورت خود اظهاری و چه به صورت اطلاعات دریافتی غیر مستقیم تصمیم بگیریم. می‌توانیم با در نظر گرفتن موقعیت جغرافیایی، بهترین مجموعه از تبلیغات و محتوا را به مشتری نشان دهیم و ایشان را در فکر به محصول و اتمسفر مدنظر خودمان نگه داریم. در مورد نگهداری مشتری مسئله کمی قابل تخمین‌تر است، چرا که ما رفتار مشتریان خود را در طول حضورشان در فضای کسب و کارمان می‌توانیم رصد کنیم. در هر صورت با داشتن اطلاعات رفتار مشتری، پیش‌بینی آنکه چه خدماتی در آینده نزدیک و دور باب میل مشتری است، کار سختی نیست و با این عمل، احتمال وابسته شدن مشتری و حضور ایشان در کسب و کار مدنظر به صورت چشم‌گیری ارتقا خواهد یافت.

پیش‌بینی رفتار و سلیقه‌ی مشتری، درک نظر واقعی مشتری با نوع حیاتی که مشتری در سیستم‌های مختلف دارد می‌تواند، ما را در یافتن " مسیر زندگی مشتری" یاری کند. هر مشتری در سیستم ما مسیر زندگی مختص خودش را دارد و ما انواع زیادی از مشتری داریم که هر کدام مسیر زندگی متفاوتی در سیستممان دارند. ما می‌توانیم کشف کنیم که کدام مشتری، چقدر از مسیر زندگی پیش‌بینی شده فاصله گرفته و خارج از عرف عمل می‌کند، یا می‌توانیم بفهمیم کدام مشتری نزدیک به پایان مسیر زندگی در سیستم است و چرا. در این مرحله با استفاده از ابزار و اطلاعات لازم از ترک سیستم توسط ایشان و از دست رفتن آن‌ها جلوگیری می‌کنیم.


– تبلیغات هدفمند و مخاطب محور:


تبلیغات بخش موثر و پر هزینه‌ی گسترش کسب و کارها است. احتمالا مشاهده کرده‎‌اید که در فرم‌های مختلف سازمان ها و موسسات از شما می‌پرسند " از چه طریق با ما آشنا شدید؟". یکی از کارکردهای این سوال تحلیل این مسئله است که کدام یک از روش‌های تبلیغاتی موثرتر از باقی آن‌ها عمل کرده و با استفاده از این دانش، هزینه‌ی تبلیغات با هدفمند شدنشان کاهش یابد.

حال چگونه می‌توان مخاطب را شناسایی کرد و تبلیغات هدفمندی را به ایشان ارائه داد؟ بخش زیادی از پروژه‌های دسته‌بندی مشتری، تحلیل احساس مشتری، سیستم‌های پیشنهاد دهنده، نگهداری مشتری و غیره دارای تحلیل‌ها و فرایندهای مشترک هستند. بنابراین اکثر آنچه در این پروژه‌ها انجام می‌شود، در پروژه‌های دیگر نیز کاربرد دارد.

جهت هدفمند شدن تبلیغات محتمل است که ما تصمیم به انجام "تحلیل احساس مشتری" بگیریم و خروجی این مرحله را در زیر سیستم نگهداری مشتری، پیش بینی رفتار آینده مشتری، سیستم‌های پیشنهاد دهنده و تولید محتوای آینده استفاده کنیم. اما استفاده‌ی نهایی ما تعیین کننده‌ی مسیر انجام پروژه و کنترل کیفیت ماژول‌های خاص پروژه ما است.


– تحلیل محتوای مورد استفاده در رسانه:


به این سوالات دقت کنید. چه می‌خوانند؟ چه چیزی را دوست دارند و چه چیزی را دوست ندارند؟ چه نظری دارند؟ به دنبال چه هستند؟ کدام مطلب بر سر راهشان زیاد و اضافه است؟ و تاثیر کدام تا چه اندازه بهتر است؟
امروزه پیش‌بینی رفتار مخاطبان با تحلیل فضای مجازی و رفتار مشتری در شبکه‌ی کسب و کار شخصی قابل تشخیص است. با مشخص شدن پاسخ این سوالات ما می‌دانیم جامعه‌ی هدفمان کیست، چقدر است، موثرترین عامل بر روی آن‌ها چیست و ... با دانستن این موارد با کمترین هزینه، موثرترین موارد را تولید و یا به آن‌ها پیشنهاد می‌دهیم و می‌دانیم از چه چیزی اجتناب کنیم.

در باب مهارت فنی لازم باید گفت که تکنینک کافی ودانش لازم درپردازش متن جزء ضروریات ماست که ارزش آن نیاز به یاداوری ندارد. درحال حاضر لایک‌ها ، کامنت‌ها، تاریخچه‌ی کلیک بر روی آیکون‌های سایت، علاقه‌مندی دوستان مجازی و چند مورد دیگر از مواردی است که برای پیش‌بینی و تحلیل رفتار مشتریان قابل دسترسی است.


– تحلیل در لحظه یا یادگیری جریانی:


در برخی کسب و کارها، به دلیل سرعت بالای تغییرات، داده‌ها به صورت لحظه‌ای به سیستم اضافه می‌شوند؛ مانند قیمت طلا و دلار در بازار بورس جهانی. در این موارد نیاز به سیستم‌های هوشمندی است که داده‌ها را به صورت Real Time پردازش و نتایج را بر روی تصمیم‌گیری‌ها اعمال کند. هر تغییر و یا Content Drift در این سیستم وارد الگوریتم شده و به طور خودکار نتایج را به‌روز میکند و اگر سیستم دارای قابلیت تصمیم‌گیری خودکار باشد، براساس نتایج تصمیمات جدیدی را اتخاذ می‌کند.

معماری و طراحی این سیستم‌ها نیاز به تکنیک و پیچیدگی بیشتر دارد و چالش‌های متفاوتی نسبت سیستم‌های Batch یا پردازش دست جمعی دارد.


شاخه های بسیاری را می‌توان در کاربرد علم داده نام برد. از جمله:


  • نظامی: بهینه کردن محل برخورد موشک، تشخیص حملات سایبری و غیره
  • تولید محتوا
  • بررسی وقایع اجتماعی
  • راه‌اندازی کمپین انتخاباتی و تبلیغاتی
  • قانون‌گذاری خرد و کلان
  •  پیش‌بینی تاثیر قوانین وضع شده در حوزه‌ی مالی، اجتماعی و غیره


اما در آخر باید در نظر داشت که تمامی توانمدی دانشمند علم داده بر اساس داده‌ها موجود است. متاسفانه یکی از آفات بزرگ فعلی برای اجرای پروژه های موفق علم داده‌ای، عدم ثبت وقایع و موضوعات ارزشمند است. این موارد باید توسط دانشمندان علوم داده در اسرع وقت شناسایی شده و به کارفرما یا تیم تولید کننده نرم افزار گزارش شود. اما این نکته نباید ذات کنجکاوانه و تحلیلی ما را تحت تاثیر قرار دهد. چرا که در بسیاری از مواقع داده‌هایی که مورد نیاز هستند اما ثبت نشده‌اند و یا به هر دلیل در دسترس نیستند، از طریق داده‌های موجود دیگر قابل احصا هستند.



منبع:nikamooz.com