הצטרפו לקבוצות שלנו לקבלת עדכונים מרוכזים פעם בשבוע:

ווטסאפ:
http://wa.dwh.co.il
טלגרם:
http://telegram.dwh.co.il

Intelligence By Objectives - I.B.O

More
18 years 11 months ago #319 by Jacob Bar
כריית נתונים יכולה לספק למשתמש בה תובנות עסקיות משמעותיות ובעלות תועלת עסקית בתנאים הבאים:
1. יש קורלציה ישרה וגבוהה בין יעדי הארגון לבין המשתנים והנתונים הנבדקים
2. המשתנים והנתונים הנבדקים הינם בבחינת Need To Know ולא Nice To Have
3. כריית הנתונים נעשית במקומות הנכונים (בבסיסי הנתונים הנכונים)
דוגמאות (קיצוניות למדי): אין טעם לבדוק את תבניות המידע ולחפש את הקשר בין צבע תחתוני הלקוחות והיקף קניותיהם
אין טעם להפעיל את כלי כריית הנתונים לקבלת תובנות על רווחיות החברה, על בסיס הנתונים של עובדי הארגון....
במילים אחרות עוד בטרם מפעילים כלי כרייה יש להגדיר עבורם:
1. מה שואלים
2. איך שואלים (תרגום השאלות הוורבאליות לשפת המקורות SQL וכד'). 
3. היכן מחפשים
כל זאת כנגזרת של יעדים ומטרות להשגה.
למיטב ידיעתי אף לא אחד מכלי כריית הנתונים ואו מחסני הנתונים מטפלים בבעיות אלו.

Please התחברות to join the conversation.

More
18 years 11 months ago #322 by Administrator
יעקב,

גישה מאד מעניינת. יש לך עוד חומר בנושא?


תמיר

Please התחברות to join the conversation.

More
18 years 11 months ago #326 by Jacob Bar
תמיר שלום,
נא שלח אלי את המייל שלך ואשלח לך חומר על I.B.O.
יעקב בר

Please התחברות to join the conversation.

More
18 years 11 months ago #327 by Edith Ohri
יעקוב יקירי,
מזה הפרסום המסחרי שהקפצת הנה? סלח לי, אך הוצאתי אותו. זאת כדי שהדיון יישאר בתחום העובדות המוסברות...

בקשר להערה על חוסר כלים ראויים, ישנו הפתרון GT data mining. הוא  מספק את הדרישות שהצבת ועוד כמה שחסרו לי בתיאור שלך. הנה שתי דוגמאות:

(1) הדרישה ליציבות המסקנות, שיהיה אפשר לבסס עליהן החלטות ניהול. אם הגורמים אינם יציבים, או שהם לא עלינו תלויי-מדגם, עדיף לסגור את המחשב, כי זה בדיוק המקרה שבו המחשב מסוגל לעשות יותר מהר והרבה יותר הרבה טעויות מכולנו.

(2) הדרישה לגילוי מוקדם. אפקט הזמן הוא קריטי, זה לא חדש. מי שמגלה מוקדם, מרוויח כפול - מונע בעיות ומנצל הזדמנויות. הצרה בפתרונות כריית נתונים הגדולים כולל זה שלך היא, שלא ניתן להבחין בהם בתופעות חריגות, אלה שמענינות את early detection. החריגים נבלעים בתוך השונות הכללית. לעיתים יש מזל ולחריגים יש שורש משותף שמצמיח הסבר. יתר החריגים נשארים קבורים באדמה, ומהווים זבל אורגני פורה לצרות שיבואו.

יכולות כנ"ל הן תוצאה של תפיסת פתרון אחרת, לא אותו זמיר מכביר שיר, שממחזרים לנו הפתרונות הגדולים.


בברכה
אדית

Please התחברות to join the conversation.

More
18 years 10 months ago #419 by Edith Ohri
לגבי ההקדמה, נו באמת, ברור שאף אחד לא יטרח לבזבז זמן על מטרות לא-לענין או על נתונים שלא קשורים. 

מי שהתרגל לסטטיסטיקה, ממשיך גם בכריית נתונים להגדיר שאלות והשערות לפני ניתוח הנתונים, וכאן הוא טועה בגדול! זה ההבדל בין שתי השיטות. בסטטיסטיקה צריך להגדיר מה מחפשים, בכריית נתונים - לא. בגלל זה בדיוק הסטטיסטיקה הפסיקה להביא תועלת: איך אפשר לדעת מה לשאול כשאין מושג איזה תופעות מתחבאות בנתונים???

שימו לב והיזהרו מהטעות: SQL היא סתם טכניקה לחיתוך נתונים, ואין לה שום קשר לכריית נתונים. יותר מזה, אי אפשר להשיג כריית נתונים בעזרת SQL, מהסיבה הפשוטה שזו טכניקה דטרמיניסטית והעולם המורכב המיוצג בנתונים הוא ממש לא כזה.

הקטע שנכתב בענין I.B.O כאילו ניתן להוציא פתרון בצורה דידקטית מהמטרה, כאילו העולם מסודר בצורה לינארית -- הלוואי עלינו, המצב היה פשוט בהרבה יותר אם זה היה נכון! בפועל, בעיות הנגזרות ממטרותיהן הן מעט מזעיר,הן כבר נטחנו עד דק בעזרת סטטיסטיקה, וכל ניתוח נוסף שלהן משול להתעללות בגוויה.

ומה שנאמר "למיטב  ידיעתי אף לא אחד מכלי כריית הנתונים וכו' מטפלים בבעיות אלו", הפתרון GT data mining מטפל בבעיות אלו ובעוד כמה שלא הועלו פה לדיון, כמו לדוגמא, הבעיה של שימוש בנתונים לא דגומים שמקורם ביותר מאוסף נתונים אחד.


בברכה
אדית

Please התחברות to join the conversation.

Moderators: Edith Ohri
Time to create page: 0.282 seconds