Αντικείμενο της μελέτης

Εκπαίδευση:

Κάθε έρευνα συνίσταται στην παρατήρηση των ιδιοτήτων των αντικειμένων, προκειμένου να διασαφηνιστούν και να αξιολογηθούν οι σημαντικές σχέσεις και σχέσεις μεταξύ των δεικτών αυτών των ιδιοτήτων.

Η θεματική ενότητα περιλαμβάνει αντικείμενα,οι οποίες διαφέρουν ως προς τις ιδιότητες και με κάποιο τρόπο είναι από ορισμένες απόψεις και αλληλένδετες. Η απόφαση των προβλημάτων στον τομέα του προγραμματισμού αρχίζει με τη μελέτη του υποκείμενου τομέα.

Η θεματική περιοχή είναι μέρος της πραγματικήςέναν κόσμο που είναι άπειρος και περιέχει τόσο σημαντικά όσο και μη σημαντικά δεδομένα. Ο ερευνητής πρέπει να είναι σε θέση να διαθέσει ένα σημαντικό μέρος αυτών. Για παράδειγμα, κατά τη λήψη απόφασης για την έκδοση δανείου, όλα τα δεδομένα σχετικά με την ιδιωτική ζωή του πελάτη (είτε το έργο του συζύγου, είτε ο πελάτης ανυψώνει τα ανήλικα τέκνα, η εκπαίδευση του πελάτη κ.λπ.) θα θεωρούνται σημαντικά. Και προκειμένου να επιλυθεί μια άλλη εργασία που σχετίζεται με την τραπεζική, τα δεδομένα αυτά θα είναι εντελώς άσχετα. Η σημασία των δεδομένων εξαρτάται από αυτό που επιλέγουμε ως θέμα.

Στη διαδικασία της έρευνας είναι απαραίτητο να δημιουργηθεί ένα μοντέλοτομέα. Η γνώση από διαφορετικές πηγές θα πρέπει να επισημοποιηθεί. Η θεματική περιοχή τυποποιείται με οποιοδήποτε μέσο. Τα μέσα μπορεί να είναι πολύ διαφορετικά. Αυτό μπορεί να είναι μια περιγραφή κειμένου του τομέα ή μια εξειδικευμένη γραφική παράσταση. Με τη βοήθεια του μοντέλου τομέα, περιγράφονται οι διαδικασίες που εμφανίζονται σε αυτό και μελετώνται και τα δεδομένα αυτού του πεδίου μελέτης.

Η διατύπωση του προβλήματος περιλαμβάνει επίσης μια περιγραφήστατική και δυναμική συμπεριφορά αντικειμένων που ερευνούμε. Η περιγραφή της στατικής συμπεριφοράς συνεπάγεται τον χαρακτηρισμό των αντικειμένων και των ιδιοτήτων τους. Κατά την περιγραφή της δυναμικής συμπεριφοράς χαρακτηρίζονται οι λόγοι για τη συμπεριφορά των αντικειμένων.

Η δυναμική συμπεριφορά των αντικειμένων περιγράφεται συχνά μαζί με τη στατική συμπεριφορά.

Μερικές φορές η ανάλυση του θέματος και η αναφορά του προβλήματος συνδυάζονται σε ένα στάδιο.

Στο στάδιο του καθορισμού και της ανάλυσης των απαιτήσεων γιαΤα δεδομένα παράγονται με τη μοντελοποίηση των δεδομένων που είναι απαραίτητα για την υλοποίηση του Data Mining. Για το σκοπό αυτό διερευνώνται τα ζητήματα της διανομής χρηστών. αναλυτικά χαρακτηριστικά του συστήματος · ζητήματα πρόσβασης στα δεδομένα που είναι απαραίτητα για την ανάλυση.

Η περιοχή του θέματος είναι ευκολότερη στην ανάλυση καιΕίναι πιο αποτελεσματικό όταν ο οργανισμός διαθέτει μια αποθήκη δεδομένων. Ωστόσο, δεν έχουν όλες οι επιχειρήσεις αποθήκευση δεδομένων. Στην περίπτωση αυτή, η πηγή των αρχικών στοιχείων είναι λειτουργικές βάσεις δεδομένων, αναφορά και αρχειακού υλικού, δηλαδή, τα δεδομένα από τα υπάρχοντα IS (συστήματα πληροφοριών).

Μπορεί ακόμη να απαιτούνται πληροφορίες από διαχειριστές IP, εξωτερικές και εσωτερικές πηγές, διάφορα έγγραφα σε χαρτοφυλάκια, καθώς και γνώση ειδικών ή / και αποτελέσματα έρευνας.

Είναι επίσης απαραίτητο να γνωρίζουμε ότι στη διαδικασία προετοιμασίαςδεδομένα, οι προγραμματιστές του προγράμματος πρέπει να περιγράφουν όσο το δυνατόν περισσότερους παράγοντες που επηρεάζουν τη διαδικασία. Ορισμένα δεδομένα μπορούν να κωδικοποιηθούν εδώ. Για παράδειγμα, ένα από τα χαρακτηριστικά ενός πελάτη είναι το επίπεδο εισοδήματός του, το οποίο μπορεί να οριστεί ως: πολύ χαμηλό, χαμηλό, μεσαίο, υψηλό, πολύ υψηλό. Στην περίπτωση αυτή, πρέπει να καθορίσετε το επίπεδο αποφοίτησης του εισοδήματος.

Κατά τον καθορισμό της σωστής ποσότητας δεδομένων, πρέπει να λαμβάνεται υπόψη η παραγγελία των δεδομένων.

Σε περίπτωση που παραγγελθούν, είναι απαραίτητοΓια να προσδιορίσετε εάν ένα εποχιακό / κυκλικό στοιχείο περιλαμβάνεται σε ένα τέτοιο σύνολο δεδομένων. Όταν δεν παραγγέλλονται, δηλ. το σύνολο γεγονότων από τη βάση δεδομένων δεν σχετίζεται με το χρονοδιάγραμμα, τότε στη διάρκεια της συλλογής πρέπει να τηρούνται οι ακόλουθοι κανόνες:

1) ένας μικρός αριθμός εγγραφών στη βάση δεδομένων μπορεί να είναι ο λόγος για τη δημιουργία ενός ανεπαρκούς μοντέλου.

2) η ακρίβεια του μοντέλου μπορεί να βελτιωθεί με την αύξηση του αριθμού των δεδομένων.

3) τα παρωχημένα δεδομένα εξαιρούνται από το σετ.

4) Οι αλγόριθμοι που χρησιμοποιούνται για τη δημιουργία ενός μοντέλου που χρησιμοποιεί πολύ μεγάλες βάσεις δεδομένων πρέπει να είναι κλιμακωτές.