داده کاوی؛ علمی برای رشد اقتصادی و سود کلان

برخی از فروشندگان می دانند که خریدار بعد از خرید خود به دنبال چه کالایی می رود. برای مثال پس از فروش تلویزیون، مشتری به دنبال خرید میز تلویزیون جدید و تزئینات جانبی می رود.این مثالی ساده است.

در مواقع پیچیده دیگرنمی توان با استفاده از حدس و تجربه فهمید که که خریدار به دنبال کدام کالا می رود، در مواقع مشابه

 چه رفتاری از سوی یک فرد رخ می دهد ؟

مجریان بیشتر در چه زمینه ای فعالیت می کنند ؟

 و بسیاری از این موارد.

اما در پس این موارد گوناگون علمی به نام داده کاوی وجود دارد که می توان از بسیاری از موارد آگاهی یافته و براساس آن تصمیمات درست و بموقع گرفت و سود سرشاری را نصیب خود کرد.

این نوع استفاده از داده کاوی می‌تواند فروشگاه‌ها را در برگزاری هوشمندانه فستیوال‌های فروش و نحوه ارایه اجناس به مشتریان کمک کند.

در یک شرکت بزرگ تکثیر و عرضه فیلم های سینمایی در امریکا، براساس دانش داده کاوی روابط مشتریان و هنرپیشگان سینمایی و گروه های مختلف مشتریان با سبک های فیلم ها مشخص شد.بعد از تعیین این رابطه که برروی حجم زیادی از داده های از جمله فیلم های خریداری شده، گروه سنی خریداران، نتایج نظرسنجی و دیگر مسایل انجام شد این شرکت توانست به طور کاملا هوشمندانه مشتریان بالقوه فیلم های سینمایی خود را براساس علاقه مشتریان به هنرپیشه های مختلف و سبک های سینمایی شناسایی و فروش خود را چند برابر کند.

اشتباه نکنید، این علم داده کاوی است نه جمع آوری اطلاعات و تحقیق روی آن ها. در واقع علم داده کاوی رشته ای میان رشته ای است که در علوم کامپیوتر، آنالیز آماری و دیگر علوم مشترک است اما خود رشته ای مستقل است.

داده کاوی توسط تجهیزات خاصی انجام می شود که عملیات کاوش براساس تجزیه و تحلیل داده ها به صورت مکرر انجام می شود.

یک استاد دانشگاه صنعتی شریف درباره تفاوت داده کاوی با روش های آنالیز آماری گفت: آمار شناسان همیشه با یک فرضیه کار خود را آغاز می کنند درحالی که یک متخصص داده کاوی به فرضیه نیازی ندارد.

جمال شهرابی افزود:

کارشناسان آنالیز آماری می توانند داده های نابجا و نادرست را در طول آنالیز مشخص کنند و نتایج کار خود را تفسیر کنند ولی این درحالی است که یک کارشناس داده کاوی به داده های صحیح و درست نیازمند است و به دلیل پیچیدگی بیش از حد نیاز به متخصصانی برای تفسیر دارد.

تکنیکهای داده کاوی عموما برای استخراج دانش و الگو از مجموعه داده های بزرگ و به منظور یادگیری و پیش بینی شرایط جدید به کار می روند.این روش ها در زمینه هایی که داده های زیادی تولید می کنند وپردازش این داده ها به صورت دستی ممکن نیست مورد استفاده قرار می گیرند.

با پیشرفت تکنولوژی امروز داده های بسیاری در زمینه ترافیک تولید می شوند که امکان پردازش دستی در آنها وجود ندارد. یکی از مسایلی که در این زمینه مطرح می شود پیش بینی وضعیت ترافیک است. ابزار داده کاوی داده را دریافت می کند و پس از ساختن یک تصویر از واقعیت به شکل یک مدل قابل لمس، رابطه موجود میان داده های مختلف را شرح می دهد.

استاد دانشگاه صنعتی خواجه نصیر در تعریفی از دانش داده کاوی به گزارشگر علمی ایرنا گفت:

دانش داده کاوی فرآیند کشف دانش پنهان درون داده ها است که با برخورداری از دامنه وسیع زیرزمینه های تخصصی با توصیف، تشریح، پیش بینی و کنترل پدیده های گوناگون پیرامونی، امروزه دارای کاربرد بسیار وسیع در حوزه های مختلف از جمله صنعتی، پزشکی، ارتباطات، کشاورزی، انرژی، علوم اجتماعی، فرهنگی، سیاسی، اقتصادی، بازرگانی، نظامی و آموزشی و دیگر موارد است.

وی افزود: دانش داده کاوی یکی از 10 دانش در حال توسعه ای است که دهه آینده را با انقلاب تکنولوژیک مواجه خواهد ساخت و در سال های اخیر گسترش سریعی داشته است.شهرابی گفت: دانش داده کاوی سازمان‌ها را قادر می‌کند تا از سرمایه داده هایشان بهره برداری کنند. این ابزار برای پشتیبان فرایند تصمیم گیری استفاده می‌شود. داده کاوی با پردازش جامع داده و انجام فرایند تصمیم سازی از طریق استخراج دانش با ارزش از داده، تصمیم گیری را برای مدیران سازمان تسهیل می‌کند.

وی با بیان این که کشورهای کانادا و آمریکا در به کارگیری از دانش داده کاوی پیشرو هستند، تصریح کرد: دانش داده کاوی شرایط موجود را توصیف کرده و سپس تحلیل و آینده را پیش بینی می‌کند و در نهایت آینده را در کنترل خود درمی‌آورد.شهرابی گفت: در حال حاضر عمده دانشگاه‌های بزرگ جهان بخش داده کاوی را به شدت دنبال می‌کنند به طوری که دانشکده‌های مهندسی صنایع با رویکرد داده‌کاوی راه‌اندازی می‌شود.

استاد دانشگاه صنعتی امیرکبیر درباره گروه های هدف علم داده کاوی معتقد است: داده کاوی در علومی که هرگز تصور نمی شود کاربرد دارد که از آن جمله می توان به حوزه های بانک، بیمه، صنعت خودرو، جرم شناسی و بزه، بخش مالی صنعت مخابرات، بازاریابی، پتروشیمی، بورس و سهام و رتبه بندی کنکور سراسری نام برد.وی گفت: فرآورده های سوختی، مشاوره های دانشجویی، مشاوره های پزشکی، مدل های تشخیص تومورهای سرطانی، بهینه سازی ژن ها، وب کاوی و متن کاوی و آنالیز داده های قضایی از جمله مواردی است که در حال حاضر از طریق علم داده کاوی به نتایج قابل ملاحظه ای در این موارد دست یافته اند.

این متخصص دانش داده کاوی درباره روند رشد این علم در کشور خاطرنشان کرد: علم داده کاوی هم اکنون میان اقشار دانشگاهی کشور به طور کامل شناخته شده است و هم اکنون در صنایع مختلف از این استفاده می شود.در سال های گذشته حجم زیادی از اطلاعات پردازش نشده در پایگاه های داده اداره ها ذخیره و نگهداری شده اند.در حال حاضر سازمان ها داده های غنی زیادی دارند اما فاقد دانش کافی برای پردازش این داده ها هستند.

براساس اطلاعات منتشر شده در حال حاضر میزان داده های در دسترس در هر 5 سال 2 برابر می شود.به گفته کارشناسان سازمانی موفق است که بتواند دست کم 7 درصد از اطلاعات ذخیره شده خود را مدیریت کند و از روش آزمون و خطا استفاده نکند.این درحالی است که براساس تحقیقات انجام شده در کشور، سازمان ها کمتر از یک درصد داده های ذخیره شده را برای تحلیل استفاده می کنند.

 

مثالي كلاسيك از كاربرد داده كاوي

اغلب تجارت ها به تصميم گيري استراتژيك و يا اتخاذ خط مشي هاي جديد براي خدمت رساني بهتر مشتريان نياز دارند. به عنوان مثال فروشگاه ها آرايش مغازه خود را براي ايجاد ميل بيشتر به خريد مجددا طراحي مي كنند. اين مثال به داده هايي در مورد رفتار مصرفي گذشته مشتريان براي تعيين الگويي به وسيله داده كاوي ، نياز دارند. براي روشن تر شدن مساله مي توان مثال را اين گونه بيان كرد كه در يك فروشگاه زنجيره اي پس از داده كاوي مشخص مي شود كه درصدي از مشتريان خريد تلويزيون ، ميز تلويزيون و گلدان كريستالي را هم در همان روز و بعد از خريد تلويزيون مي خرند. مدير فروشگاه مي تواند بلافاصله دستوراتي صادر كند كه بر اساس مدل هاي تلويزيون موجود ميزهايي و براساس مدل ميزها گلدان هاي كريستالي براي فروش سفارش داده شود و غرفه هاي جنبي غرفه تلويزيون را به ميز و گلدان کريستالي اختصاص دهد . مطمئنا" حتي پس از مدت کوتاهي سود حاصل از اين بخش از فروشگاه به طور قابل ملاحظه اي ترقي خواهد کرد .
در واقع ابزار داده کاوي ،داده را مي گيرد و يک تصوير از واقعيت به شکل مدل مي سازد که اين مدل روابط موجود در داده ها را شرح مي دهد. براي بهبودي بهره وري از يک فروشگاه داده کاوي از داده هاي انبار داده، مدل هايي را ارائه مي دهد که بيانگر اين هستند که چه محصولاتي يا خدماتي ،به چه مشترياني،در چه زماني واز طريق چه کانالي عرضه شود. بيشتر شرکت ها بانک هاي داده اي عظيمي،شامل داده هاي بازاريابي،منايع انساني و مالي را دارا هستند . بنابراين سرمايه گذاري در زمينه انبار داده ، يکي از اجزاي حياتي در استراتژي ارتباط با مشتري است.رابطه مشتري با زمان تغيير مي کند و چنانچه تجارت و مشتري درباره يکديگر بيشتر بدانند اين رابطه تکامل ورشد مي يابد. چرخه زندگي مشتري چارچوب خوبي براي به کارگيري داده کاوي در مديريت ارتباط با مشتري فراهم مي کند .در بخش ورودي داده کاوي،چرخه زندگي مشتري مي گويد چه اطلاعاتي در دسترس است و در بخش خروجي آن چرخه زندگي مشتري مي گويد چه چيزي احتمالا" جالب توجه است و چه تصميماتي بايد گرفته شود. داده کاوي مي تواند سود آوري مشتري هاي بالقوه را که مي توانند به مشتريان بالفعل تبديل شوند،پيش بيني کند و اينکه مشتري تا چه زماني وفادار خواهد ماند وچگونه احتمالا" مارا ترک خواهد کرد.

بعضي از مشتريان مرتبا" مراجعاتشان رابه شرکت ها براي کسب مزيت هايي که طي رقابت ميان آنها به وجود مي آيد، تغيير مي دهند . در اين صورت شرکت ها مي توانند هدفشان را روي مشترياني متمرکز کنند که سود آوري بيشتري دارند . بنابراين مي توان از طريق داده کاوي ارزش مشتريان را تعيين ، رفتار آينده آنها راپيش بيني و تصميمات آگاهانه اي را در اين رابطه اتخاذ کرد.

 

داده کاوی و ضرورت بکارگیری آن در عصر حاضر


از هنگامي که رايانه در تحليل و ذخيره‌سازي داده‌ها به‌کار رفت (1950) پس از حدود 20 سال، حجم داده‌ها در پايگاه داده‌ها دو برابر شد. ولي پس از گذشت دو دهه و همزمان با پيشرفت فن آوري اطلاعات(IT) هر دو سال يکبار حجم داده‌ها، دو برابر شد. همچنين تعداد پايگاه داده‌ها با سرعت بيشتري رشد نمود. اين در حالي است که تعداد متخصصين تحليل داده‌ها و آمارشناسان با اين سرعت رشد نكرد. حتي اگر چنين امري اتفاق مي‌افتاد، بسياري از پايگاه داده‌ها چنان گسترش يافته‌اند که شامل چند‌صدميليون يا چندصدميليارد رکورد ثبت شده هستند و امکان تحليل و استخراج اطلاعات با روش‌هاي معمول آماري از دل انبوه داده‌ها مستلزم چند روز کار با رايانه‌هاي موجود است.

حال با وجود سيستم‌هاي يکپارچه اطلاعاتي، سيستم‌هاي يکپارچه بانکي و تجارت الکترونيک، لحظه‌به‌لحظه به حجم‌داده‌ها در پايگاه داده‌هاي مربوط اضافه شده و باعث به وجود آمدن انبارهاي عظيمي از داده‌ها شده است به طوري که ضرورت کشف و استخراج سريع و دقيق دانش از اين پايگاه‌داده‌ها را بيش‌از‌پيش نمايان کرده‌است . چنان‌که در عصر حاضر گفته مي‌شود ، اطلاعات طلاست .   مهريزي، ع.ا.، 1382

فن‌آوری‌کنونی سخت‌افزار و پایگاه داده‌ها، امکان ذخیره‌سازی و دستیابی کارا، ارزان و قابل اطمینان به داده‌ها را فراهم می‌آورد. امّا در هر زمینه‌ای مانند تجارت، پزشکی، ابزارهای تعیین هویت، یا کارت اعتباری، الگوهای موجود در تماس‌های تلفنی، خود این مجموعه‌داده‌ها (که به شکل خام) ارزش مستقیم اندکی دارند و در واقع آن چیزی که ارزشمند است، دانشی می‌باشد که از این مجموعه‌های داده‌ای استنتاج و به‌کارگیری می‌شود. به عنوان مثال، پایگاه‌های داده‌ای بازاریابی محصولات شرکت، می‌توانند حاوی دانش همبستگی بین فروش اقلامی خاص و گروه‌بندی‌های جمعیتی معین باشد. این دانش، قادر است تا در معرفی سیاست‌های هدفدار و جدید بازاریابی با بازگشت سرمایه‌ی قابل پیش‌بینی استفاده شود. پایگاه‌های داده‌ای منابع بالقوه‌ای هستند که می‌توانند فواید عمده‌ای داشته باشند. سعیدی، ا.، 1384
فنون داده‌کاوی، نتیجه‌ی تحقیقات طولانی و توسعه‌ی محصولات می‌باشد. این تحول بر روی داده‌های تجاری بدین صورت شکل گرفت. ابتدا داده‌ها در کامپیوترها ذخیره می‌شدند، بعد، پس از کمی پیشرفت، می‌توانستند به این داده‌ها دسترسی پیدا کنند و اخیراً فن‌آوری‌هایی را تولید نمودند که به کاربران اجازه می‌داد تا داده‌های خود را به صورت بلادرنگ، همیشه همراه خود داشته باشند. شاه‌سمندي، پ.، 1384

هم‌اکنون در هر کشور، سازمان‌ها، شرکت‌ها و . . . براي امور بازرگاني، پرسنلي، آموزشي، آماري و . . . پايگاه داده‌ها ايجاد يا خريداري شده‌است، به طوري‌که اين پايگاه‌داده‌ها براي مديران، برنامه‌ريزان، پژوهشگران و . . . جهت تصميم‌گيري‌هاي راهبردي، تهيه گزارش‌هاي مختلف، توصيف وضعيت جاري خود و . . . مي‌تواند مفيد باشد. داده‌کاوي يا استخراج و کشف سريع و دقيق اطلاعات با‌ارزش و پنهان از اين پايگاه‌داده‌ها از جمله اموري است که هر کشور، سازمان و شرکتي به‌منظور توسعه علمي، فني و اقتصادي خود به‌آن نياز دارد. Mento, 2003
در کشور ما نيز سازمان‌ها، شرکت‌ها و مؤسسات دولتي و خصوصي به طور فزاينده ولي آهسته در حال ايجاد يا خريد نرم افزارهاي پايگاه داده‌ها و مکانيزه کردن سيستم‌هاي اطلاعات خود هستند، همچنين با توجه به فصول دهم و يازدهم قانون برنامه سوم توسعه در خصوص دادوستدهاي الکترونيکي و همچنين تأکيد بر برخورداري کشور از فن‌آوري‌هاي جديد اطلاعات براي دستيابي آسان به‌اطلاعات داخلي و خارجي، دولت مکلف شده است امکانات لازم براي دستيابي آسان به اطلاعات، زمينه‌سازي براي اتصال کشور به شبکه‌هاي جهاني و ايجاد زيرساخت‌هاي ارتباطي و شاهراه‌هاي اطلاعاتي فراهم کند. واضح است اين امر باعث ايجاد پايگاه‌هاي عظيم داده‌ها شده و ضرورت استفاده از داده‌کاوي را بيش ‌از ‌پيش نمايان مي‌سازد.

منبع : http://www.phq.ir