داده کاوی (Data Mining) روزبهروز محبوبیت بیشتری پیدا میکند، اما هنوز بسیاری از مردم نمیدانند که این مفهوم به چه چیزی اشاره میکند. بسیاری از شرکتهای آنلاین در رابطه با نحوه استفاده از دادهکاوی جهت بهبود کیفیت خدمات خود، صحبت میکنند. در ادامه این مطلب میخواهیم بدانیم که دادهکاوی چیست و آیا اصلا قانونی است؟
داده کاوی چیست و چگونه کار میکند؟
دادهکاوی فرایندی است که طی آن، شرکتها و متخصصان داده سعی میکنند که اطلاعات را از دادههای خام استخراج کرده تا بدین ترتیب بتوانند گرایشها (ترندها) را پیدا کنند. دادههای خام مورد استفاده در این فرایند را میتوان از منابع گوناگونی همچون نظرسنجیهای آنلاین، دادههای جمعآوری شده توسط کوکیها و یا رکوردهای عمومی، به دست آورد.
البته تمامی دادهها مفید نیستند. دادهها باید دقیق، به دور از جانبداری بوده، کمترین شکافها را داشته و همچنین جهت حصول نتایج معتبر، حجم بالایی نیز داشته باشند. از آنجایی که شما در عوض دادههای آماری از پیش آماده، با دادههای خام کار میکنید، پس داده کاوی میتواند یک فرایند چند جانبه باشد. میتوانید دادههای مشخصی را چندین بار و به طرق مختلف، پردازش کنید و هر بار به دنبال گرایش مختلفی بگردید. این موضوع باعث میشود که بینشهای به دست آمده از یک دسته داده مشخص، عملا نامحدود باشند.
از آنجایی که استخراج گرایشهای مخفی شده در دادهها، نیازمند خلاقیت و تواناییهای بسیاری است، پس روش خاصی نیز جهت دادهکاوی وجود ندارد. البته در هر صورت، این فرایند را میتوان به 5 گام اصلی زیر، تقسیم کرد:
1. پیدا کردن منبع دادهها
اولین گام این است که منبعی را برای دادههای خود مشخص کرده و سپس دادهها را به یک سرور ذخیرهسازی، وارد کنید. این همان جایی است که در آن، اولین برداشتها و منابع اطلاعاتی، بیشترین اهمیت را پیدا میکنند. جهت حصول اطمینان از نتایج به دست آمده باید از معتبر بودن منابع دادهها، اطمینان حاصل کنید.
این مطلب را نیز بخوانید: تأثیر هوش مصنوعی بر درک دادهها و بازاریابی دیجیتال چگونه است؟
2. انتخاب محیط کار
اگر از سیستمها و دستگاههای محلی و یا یک محیط ابری استفاده میکنید، در هر صورت اکنون وقت اعمال تغییرات است. در هر صورت، محیط کاری شما باید آنقدر قوی باشد که بتواند حجم داده موردنیاز جهت پردازش را مدیریت کند. اگر بهصورت گروهی کار میکنید، آنگاه دسترسیپذیری باید از اولویتهای شما باشد. به همین دلیل، محیطهای ابری در این زمینه میتوانند از بهترین انتخابها باشند.
3. تقسیمبندی و دستهبندی دادهها
چه دادههای شما دارای تگ باشند و چه نباشند، در هر صورت نیاز دارید که پیش از شروع فرایند پردازش، آنها در دستهبندیهای مرتبط با نوع اطلاعات و یا الگوهای موردنظر جهت استخراج، قرار دهید. بسته به حجم اطلاعات، شاید نیاز باشد که به جای کار بر روی تمامی اطلاعات بهصورت یکجا، این کار را بهصورت بخشبخش انجام دهید.
4. داده کاوی
پس از آماده کردن دادهها و سپس مشخص کردن خواسته و هدف خود، این بار نوبت به فرایند اصلی دادهکاوی و استخراج اطلاعات میرسد. در این مرحله جهت پیشبرد کارهای خود میتوانید از نرمافزارهای مخصوص استفاده کرده و یا اینکه بهصورت مستقل و با استفاده از زبانهای برنامهنویسی سازگار همانند R ،Python و SQL، این کار را انجام دهید.
در دادهکاوی با استفاده از مدلهای ریاضی، سعی میشود که بینشهای سطحی از دادههای خام به دست آیند. البته نباید مفهوم دادهکاوی را با آنالیز دادهها اشتباه بگیرید. دومی از دادهها و بینشهایی که معمولا توسط دادهکاوی به دست آمدهاند، استفاده کرده و بدین ترتیب به مدلسازی و پیشبینی میپردازد.
5. ترجمه کردن نتایج
سخت است که نتایج دادهکاوی را بهخودیخود درک کرد. گام نهایی این است که این دادههای به دست آمده را از طریق ترجمه کردن آنها در قالب نمودار و یا جدولها، به تصویر بکشیم. شاید نتایج تصویری، چندان استفادهای جهت تحلیلهای آینده و یا سایر دادهکاویها نداشته باشند، اما در هر صورت میتوانند درک یافتهها و همچنین بهاشتراکگذاری آنها را آسانتر کنند.
این مطلب را نیز بخوانید: رایانش مرزی (Edge Computing) چیست و چگونه آینده را متحول میکند؟
دادهکاوی چه کاربردی دارد؟
با استفاده از دادهکاوی میتوانید در رابطه با هر چه که دادههای خام مرتبط با آن را جمعآوری کردهاید، اطلاعات گوناگونی را به دست آورید. به هر حال، کسبوکارهای بزرگ و وبسایتها معمولا از دادهکاوی جهت پیشبینی کردن و تحلیل رفتار مشتریان و کاربران هدف، استفاده میکنند.
شرکتهایی که در زمینه خردهفروشی و یا تجارت الکترونیک فعالیت دارند، میتوانند دادهها از طریق حسابهای کاربران، جمعآوری کنند. این کار نیز توسط نظرسنجیها و یا ثبت کردن فعالیت کاربر بر روی وبسایت و یا اپلیکیشن آن کسبوکار، صورت میپذیرد. در ادامه کسبوکارها میتوانند به دادهکاوی پرداخته و در خریدها به دنبال گرایشها بگردند. این فرایند میتواند بر اساس زمان مشخصی از روز و یا هفته، تناوب بازدید و یا خریدهای مرتبط باشد.
در حقیقت، این دادهکاوی است که به فروشگاهها امکان میدهد در زمانی که مردم قصد خرید دارند، پیشنهادها و اعلانهای تخفیف را به آنها ارسال کنند. این روش نهتنها باعث افزایش درآمد میشود، بلکه کارایی بیشتری نیز داشته و همچنین یک تکنیک بازاریابی کاراتر از لحاظ هزینه است.
البته فقط کسبوکارها از دادهکاوی استفاده نمیکنند. این فرایند حتی در زمینه تحلیل و بررسی جرم و جنایت نیز کاربرد دارد. بدین ترتیب دولت میتواند مکانها و همچنین ساعتهایی را که بیشترین جنایت در آنها اتفاق میافتد، شناسایی کند.
دادهکاوی در زمینه پیشبینهای آبوهوایی نیز کاربرد دارد. این فرایند به هواشناسان کمک میکند که حجم بالایی از دادههای جمعآوری شده در رابطه با آبوهوا را بهصورت کل و یا بخشبخش، در طول یک دوره مشخص مورد تحلیل قرار دهند.
آیا دادهکاوی غیرقانونی است؟
دادهکاوی به خودیخود، غیرقانونی نیست. این قضیه بیشتر به منبع اطلاعات و همچنین موارد استفاده از نتایج، مربوط میشود. دادهها باید یا عمومی باشند، یا اینکه بهصورت توافقی و غیر مخفیانه به دست آمده باشند. این قضیه بدین معنا است که کاربران وبسایتها و اپلیکیشنها و یا شرکتکنندگان در نظرسنجیهای آنلاین و آفلاین، باید بدانند که از پاسخها و اطلاعات به دست آمده در رابطه با آنها، جهت تحلیلها و دادهکاوی استفاده میشود.
شرکتها و مؤسسههایی که حق استفاده از دادهها را ندارند نیز میتوانند بسته به منبع دادهها، قوانین داخلی و یا خارجی مرتبط با حریم خصوصی را نقص کنند. ناگفته نماند که اکثر کشورها استفاده از بینشهای دادهکاوی جهت اعمال تبعیض علیه اشخاص بر اساس سن، جنسیت، نژاد و یا دین را ممنوع کردهاند.
این مطلب را نیز بخوانید: CRM چیست و چگونه به کسبوکارها کمک میکند؟
از کجا باید شروع کرد؟
در بالا سعی کردیم که در رابطه با دادهکاوی و مباحث قانونی مرتبط با آن، توضیحاتی را به شما ارائه دهیم. این فرایند فقط به شرکتهای بزرگ که منابع اطلاعاتی و توان پردازشی بالایی را در اختیار دارند، محدود نمیشود. مادامی که در این کار سررشته داشته، به یادگیری در این زمینه علاقهمند بوده و همچنین بهصورت قانونی به دادهها دسترسی پیدا کنید، آنگاه میتوانید به داده کاوی نیز بپردازید.
اولین قدم مربوط به به دست آوردن قانونی و اخلاقی دادهها است. خوشبختانه در این رابطه لازم نیست که به خرید و یا ایجاد یک نظرسنجی آنلاین بپردازید. از طریق وبسایتهای زیر میتوانید بهصورت رایگان به دادههای عمومی در زمینههای مختلف، دسترسی پیدا کنید:
- Data.gov
- Earthdata
- Pew Research Center
- National Climatic Data Center
- Global Health Observatory Data
در رابطه با نرمافزار دادهکاوی نیز گزینههای رایگانی وجود دارند. یکی از این گزینهها، Orange است. این نرمافزار بر مبنای زبان برنامهنویسی Python بوده و برای تازهکارها مناسب است. اگر هم به دنبال نرمافزاری میگردید که بتواند الگوریتمهای دادهکاوی پیشرفته را اجرا کند، آنگاه میتوانید از open-source data mining tool, R استفاده کنید. اگر همچنان به این موضوع علاقه داشته؛ اما در رابطه با شروع کار چندان مطمئن نیستید، آنگاه شاید بد نباشد که از مطالعه در رابطه با پایههای آنالیز داده، شروع کنید.
سخن پایانی
ما اکنون در عصر دادهها و اطلاعات هستیم و بنابراین دادهکاوی نیز میتواند محبوبیت بیشتری به دست آورد. شاید همچنان مباحث اخلاقی مطرح باشند، اما این فرایند میتواند جنبههای مثبت بیشتری نسبت به جنبههای منفی داشته باشد.
واسه شروع اینکار کلاسای خاصی باید رفت ؟؟
پیشرفت گوگل و فیسبوک از همین داده کاوی و استفاده از علایق کاربراشه
جالبه که بابت این جریان و عدم حفظ حریم خصوصی از فیسبوک شکایت شده و انتقاد میشه ولی گوگل کمتر ازش نقد میشه