Περίληψη
Σε μια ιδανική εφαρμογή της διαχείρισης προσωπικής πληροφορίας, οι χρήστες θα έπρεπε να έχουν πάντα διαθέσιμη την κατάλληλη πληροφορία στο σωστό μέρος και στην κατάλληλη μορφή, σε εκείνη την ποιότητα και την πληρότητα που απαιτείται για να ικανοποιήσουν τις ανάγκες τους. Η ανάγκη αυτή γίνεται ακόμα πιο επιτακτική στην περίπτωση των χρηστών συσκευών κινητού υπολογισμού, οι οποίες παρουσιάζουν ιδιαιτερότητες σε σχέση με τους σταθερούς υπολογιστές που μεγεθύνουν τις προκλήσεις και δυσχεραίνουν τη διαχείριση της προσωπικής πληροφορίας. Παρά τις τεχνολογικές εξελίξεις όσον αφορά την υπολογιστική ισχύ, τη χωρητικότητα και τη συνδεσιμότητα, οι οθόνες των συσκευών κινητού υπολογισμού παραμένουν σημαντικά μικρότερες από αυτές των σταθερών υπολογιστών, περιορίζοντας την ποσότητα πληροφορίας που μπορούν να παρουσιάσουν ταυτόχρονα, ενώ η ανάγνωση μεγάλης ποσότητας πληροφορίας σε αυτές τις συσκευές απαιτεί συχνή οριζόντια κύλιση και εστιασμένη συγκέντρωση. Επιπλέον, ο εξοπλισμός και οι εφαρμογές πο ...
Σε μια ιδανική εφαρμογή της διαχείρισης προσωπικής πληροφορίας, οι χρήστες θα έπρεπε να έχουν πάντα διαθέσιμη την κατάλληλη πληροφορία στο σωστό μέρος και στην κατάλληλη μορφή, σε εκείνη την ποιότητα και την πληρότητα που απαιτείται για να ικανοποιήσουν τις ανάγκες τους. Η ανάγκη αυτή γίνεται ακόμα πιο επιτακτική στην περίπτωση των χρηστών συσκευών κινητού υπολογισμού, οι οποίες παρουσιάζουν ιδιαιτερότητες σε σχέση με τους σταθερούς υπολογιστές που μεγεθύνουν τις προκλήσεις και δυσχεραίνουν τη διαχείριση της προσωπικής πληροφορίας. Παρά τις τεχνολογικές εξελίξεις όσον αφορά την υπολογιστική ισχύ, τη χωρητικότητα και τη συνδεσιμότητα, οι οθόνες των συσκευών κινητού υπολογισμού παραμένουν σημαντικά μικρότερες από αυτές των σταθερών υπολογιστών, περιορίζοντας την ποσότητα πληροφορίας που μπορούν να παρουσιάσουν ταυτόχρονα, ενώ η ανάγνωση μεγάλης ποσότητας πληροφορίας σε αυτές τις συσκευές απαιτεί συχνή οριζόντια κύλιση και εστιασμένη συγκέντρωση. Επιπλέον, ο εξοπλισμός και οι εφαρμογές που ενσωματώνονται σε αυτές τις συσκευές επιτρέπουν την εύκολη δημιουργία πολύ μεγάλης ποσότητας προσωπικής πληροφορίας, όπως βίντεο, φωτογραφίες, σημειώσεις κ.α. Επίσης, το πλαίσιο χρήσης αυτών των συσκευών είναι συχνά μεταβαλλόμενο (π.χ. καθώς οι χρήστες κινούνται αλλάζει η τοποθεσία τους, οι συσκευές και οι άνθρωποι με τους οποίους αλληλεπιδρούν, καθώς και οι στόχοι και οι ανάγκες τους) και πιο απαιτητικό σε σχέση με τη χρήση των σταθερών υπολογιστών. Όλα τα παραπάνω χαρακτηριστικά σε συνδυασμό με την απροθυμία των χρηστών να αφιερώσουν χρόνο και προσπάθεια για τη διαγραφή προσωπικών δεδομένων, έχει ως αποτέλεσμα να δυσχεραίνεται η ανάκτηση και επομένως η αξιοποίηση της πληροφορίας. Από την άλλη, οι συσκευές κινητού υπολογισμού είναι εξοπλισμένες με ένα πλήθος αισθητήρων που καταγράφουν το κινητό πλαίσιο του χρήστη (mobile context): τοποθεσία, δραστηριότητα (π.χ. περπάτημα, τρέξιμο, σε κλήση), επίπεδα θορύβου, περιβαλλοντικές συνθήκες κ.α. Επιπλέον, καθώς οι χρήστες τις θεωρούν έμπιστες συσκευές και τις έχουν συχνά μαζί τους σε λειτουργία σε 24ωρη βάση, περιέχουν μεγάλες ποσότητες προσωπικής πληροφορίας που σχετίζεται με το κοινωνικό περιβάλλον των χρηστών. Η πληροφορία αυτή συχνά δημιουργείται αυτόματα από τις ίδιες τις συσκευές. Για παράδειγμα, για κάθε κλήση που πραγματοποιείται σε ένα κινητό τηλέφωνο αποθηκεύεται στη λίστα κλήσεων μια σχετική εγγραφή, η οποία περιλαμβάνει την ημερομηνία και την ώρα, την επαφή, τη διάρκεια. Επίσης, μέρος της πληροφορίας δημιουργείται από τους ίδιους τους χρήστες: SMS και MMS, φωτογραφίες, βίντεο και αρχεία ήχου, γεγονότα ημερολογίου, επαφές κ.α. Συνεπώς, οι συσκευές αυτές εκτός από το κινητό πλαίσιο των χρηστών, είναι ενήμερες και για το κοινωνικό περιβάλλον τους (κοινωνικό πλαίσιο – social context). Ο συνδυασμός του κινητού και του κοινωνικού περιβάλλοντος έχει ως αποτέλεσμα ένα δυναμικά ορισμένο κοινωνικό πλαίσιο, γνωστό ως κινητό κοινωνικό πλαίσιο (mobile social context). Η προσωπική πληροφορία σχετίζεται σε μεγάλο βαθμό με το πλαίσιο, κάτι που ισχύει και για τις δραστηριότητες διαχείρισής της. Καθώς οι πληροφοριακές ανάγκες των χρηστών εξαρτώνται όχι μόνο από το κινητό πλαίσιο αλλά και από τις κοινωνικές τους αλληλεπιδράσεις, στόχος της παρούσας διδακτορικής έρευνας ήταν η δημιουργία ενός μοντέλου που αξιοποιεί την πληροφορία πλαισίου που συλλέγουν οι συσκευές κινητού υπολογισμού για να βελτιώσει τη διαχείριση της προσωπικής πληροφορίας από τους χρήστες. Το στάδιο εκείνο του κύκλου ζωής της διαχείρισης προσωπικής πληροφορίας στο οποίο δόθηκε έμφαση ήταν η αξιοποίηση. Μελετήθηκε η περίπτωση των επαφών ως αντιπροσωπευτικό πρόβλημα τομέα, επειδή το πλήθος τους αυξάνει συνεχώς με τη πάροδο των χρόνων, οι χρήστες είναι απρόθυμοι να αφιερώσουν χρόνο και προσπάθεια για την οργάνωση ή διαγραφή τους και καθώς οι συσκευές αυτές στην πιο διαδεδομένη μορφή τους (Smartphones) έχουν ως κύρια αποστολή τη διευκόλυνση της επικοινωνίας. Σκοπός ήταν να διερευνηθεί πως το πλαίσιο μπορεί να βελτιώσει την ανάκτηση των επαφών για την πραγματοποίηση επικοινωνίας και συγκεκριμένα εξερχόμενων κλήσεων. Εντούτοις, η προσέγγιση που ακολουθήθηκε και παρουσιάζεται μπορεί να επεκταθεί και να εφαρμοστεί σε οποιοδήποτε άλλο στοιχείο προσωπικής πληροφορίας (π.χ. μηνύματα, emails, σημειώσεις, φωτογραφίες, βίντεο κ.λπ.). Η διάρθρωση της παρούσας διατριβής είναι ως ακολούθως: Αρχικά, στο κεφάλαιο 1, γίνεται μια εισαγωγή στο πρόβλημα της διαχείρισης προσωπικής πληροφορίας και αναλύονται οι λόγοι που το υπό μελέτη πρόβλημα παρουσιάζει αυξημένο ενδιαφέρον για την περίπτωση των συσκευών κινητού υπολογισμού. Μετά τη διασύνδεση του προβλήματος με το κινητό κοινωνικό πλαίσιο, παρουσιάζεται το πλαίσιο εκπόνησης της διδακτορικής έρευνας: το κίνητρο, οι στόχοι και τα ερευνητικά ερωτήματα. Στο κεφάλαιο 2 παρουσιάζεται μια εκτεταμένη επισκόπηση της ερευνητικής δραστηριότητας γενικά για τη διαχείριση προσωπικής πληροφορίας σε συσκευές κινητού υπολογισμού και την αξιοποίηση του πλαισίου, αλλά και ειδικότερα για την περίπτωση των επαφών. Στο κεφάλαιο 3 προτείνεται μια μοντελοποίηση του πλαισίου με τη μορφή διανύσματος. Αν και πρόκειται για μια σχετικά απλή αναπαράσταση, επιτρέπει την εύκολη διαχείριση του πλαισίου και δίνει τη δυνατότητα μελλοντικής ενσωμάτωσης νέων διαστάσεων. Επιπλέον, επιτρέπει την εφαρμογή αλγορίθμων μείωσης διαστάσεων (dimensionality reduction). Μια αρχική ιδέα που διερευνήθηκε ήταν η μείωση των διαστάσεων του πλαισίου σε 2 ή 3, πρακτική που θα επέτρεπε την αναπαράσταση των αντικειμένων προσωπικής πληροφορίας στον δισδιάστατο ή τρισδιάστατο χώρο και ενδεχομένως θα βελτίωνε την ανάκτηση. Τελικά, η ιδέα εγκαταλείφθηκε, καθώς το πλήθος των διαστάσεων που χρησιμοποιήθηκαν δεν ήταν τέτοιο ώστε να δικαιολογεί την ανάγκη για εφαρμογή τέτοιων τεχνικών. Για τον εντοπισμό εκείνων των διαστάσεων του πλαισίου που παίζουν σημαντικό ρόλο στην ανάκτηση των επαφών κατά την έναρξη μιας κλήσης, πραγματοποιήθηκε και παρουσιάζεται πείραμα που περιελάμβανε την ανάλυση πραγματικών δεδομένων από συσκευές χρηστών. Η ανάλυση είχε ως αποτέλεσμα να εντοπιστούν δύο διαστάσεις ως σημαντικές (συχνότητα και προσφατότητα επικοινωνίας) και να απορριφθούν άλλες που χρησιμοποιούνται συχνά στη βιβλιογραφία, χωρίς όμως επαρκή αιτιολόγηση. Επιπλέον, αποκάλυψε σημαντικά στοιχεία που αφορούν τα πρότυπα επικοινωνίας των χρηστών, όπως για παράδειγμα μια συμπεριφορά σχετικά με το πλήθος των κλήσεων προς επαφές αρκετά κοντά στην αρχή Pareto. Στο κεφάλαιο 4 παρουσιάζεται ο αλγόριθμος που αναπτύχθηκε για την κατάταξη και επιλογή επαφών με τη χρήση των διαστάσεων της συχνότητας και προσφατότητας της επικοινωνίας. Ο αλγόριθμος, που λειτουργεί ως αλγόριθμος πρόβλεψης των Ν επαφών με τη μεγαλύτερη πιθανότητα να καλέσει ο χρήστης, αξιολογήθηκε με τη μέθοδο της προσομοίωσης σε διαθέσιμα σύνολα δεδομένων. Τα αποτελέσματα είναι περισσότερο ή εξίσου επιτυχή σε σχέση με αυτά που αναφέρουν αντίστοιχες ερευνητικές προσπάθειες. Επιπλέον, υλοποιήθηκαν οι σημαντικότεροι σχετικοί αλγόριθμοι που περιγράφονται στη βιβλιογραφία και έγινε απευθείας σύγκριση των αποτελεσμάτων με χρήση των ίδιων δεδομένων, όπου τα αποτελέσματα του προτεινόμενου αλγορίθμου ήταν βελτιωμένα σε σχέση με αυτά των άλλων εργασιών. Ακόμα, εντοπίστηκαν τρεις διαφορετικές κατηγορίες χρηστών σε σχέση με την «κοινωνικότητά» τους. Για τους χρήστες που είναι λίγο ή μέτρια «κοινωνικοί» η απόδοση του αλγορίθμου είναι εξαιρετικά υψηλή, ενώ για τους πολύ «κοινωνικούς» χρήστες υπάρχουν περιθώρια βελτίωσης. Επιπροσθέτως, παρατίθενται τα αποτελέσματα πειράματος πεδίου που πραγματοποιήθηκε για την αξιολόγηση του αλγορίθμου σε πραγματικές συνθήκες, από το οποίο επιβεβαιώθηκαν τα συμπεράσματα που προέκυψαν από τη διαδικασία της προσομοίωσης. Στο κεφάλαιο 5 παρουσιάζεται η μελέτη της επίπτωσης της τοποθεσίας στην ανάκτηση επαφών. Η τοποθεσία θεωρείται ως μια πολύ σημαντική διάσταση πλαισίου και προτείνεται πολύ συχνά στη βιβλιογραφία που αφορά την πρόβλεψη κλήσεων. Σε πρώτη φάση αναλύθηκαν τα δεδομένα φυσικής τοποθεσίας (physical location), χωρίς να προκύψει κάποια στατιστικά σημαντική βελτίωση στα αποτελέσματα πρόβλεψης από τη χρήση της τοποθεσίας. Στη συνέχεια, αναλύθηκαν δεδομένα σημασιολογικής τοποθεσίας (semantic location), απ’ όπου προέκυψαν παρόμοια συμπεράσματα. Αντίστοιχα συμπεράσματα προκύπτουν και από την ενσωμάτωση στον αλγόριθμο πρόβλεψης διαστάσεων που σχετίζονται έμμεσα με τη σημασιολογική τοποθεσία, όπως είναι το χρονικό πλαίσιο (ώρα της ημέρας). Αν και πρέπει να είμαστε επιφυλακτικοί στη γενίκευση των συμπερασμάτων, φαίνεται ότι η τοποθεσία δεν είναι τόσο χρήσιμος παράγοντας πλαισίου για αρκετούς χρήστες όσον αφορά το συγκεκριμένο πρόβλημα, όσο είναι διαδεδομένο ως αντίληψη στην επιστημονική κοινότητα. Τέλος, το κείμενο της διατριβής ολοκληρώνεται με τον επίλογο, όπου συνοψίζονται τα συμπεράσματα, απαντώνται τα ερευνητικά ερωτήματα και δίνεται έμφαση στη συνεισφορά της διδακτορικής έρευνας. Παράλληλα, παρουσιάζεται μια γενίκευση του προτεινόμενου μοντέλου που μπορεί να εφαρμοστεί για οποιοδήποτε τύπο προσωπικής πληροφορίας ή ακόμα και για συνδυασμό διαφορετικών τύπων.
περισσότερα
Περίληψη σε άλλη γλώσσα
In an ideal application of personal information management, users should always have available the appropriate information to the right place and in the right format, at that quality and completeness that is necessary to meet their needs. This requirement becomes even more urgent in the case of users with mobile computing devices, which face limitations compared to desktop computers that increase the challenges and complicate personal information management. Despite the technological advancements regarding computing power, storage capacity and connectivity, the screens of mobile computing devices remain significantly smaller than those of desktop computers, reducing the amount of information that can be presented simultaneously, while reading a large amount of information on these devices requires frequent horizontal scrolling and focused concentration. Moreover, the equipment and applications that are integrated in these devices allow the easy creation of big volumes of personal infor ...
In an ideal application of personal information management, users should always have available the appropriate information to the right place and in the right format, at that quality and completeness that is necessary to meet their needs. This requirement becomes even more urgent in the case of users with mobile computing devices, which face limitations compared to desktop computers that increase the challenges and complicate personal information management. Despite the technological advancements regarding computing power, storage capacity and connectivity, the screens of mobile computing devices remain significantly smaller than those of desktop computers, reducing the amount of information that can be presented simultaneously, while reading a large amount of information on these devices requires frequent horizontal scrolling and focused concentration. Moreover, the equipment and applications that are integrated in these devices allow the easy creation of big volumes of personal information data, such as videos, photos, notes, etc. Also, the context of use of these devices is often changing (e.g. while users are on the move their location changes, as well as the devices and people with whom they interact, their objectives and their needs) and it is more demanding than in the case of desktop use. The above characteristics, combined with the reluctance of users to devote time and effort to delete personal data result in information retrieval difficulties. On the other hand, mobile computing devices are equipped with a multitude of sensors that record the context of the user (mobile context): location, activity (e.g. walking, jogging, on a call), noise levels, environmental conditions etc. Furthermore, as users consider them as trusted devices and often leave them always on, they contain large amounts of personal information related to the users’ social environment. This information is often generated automatically. For example, for each call made or received on a mobile phone a relevant record is saved in the call list, which includes the date and time, the contact and the duration. Also, part of this information is generated by the users themselves: SMS and MMS, photos, videos and audio files, calendar events, contacts etc. Therefore, these devices except from the users’ mobile context are also informed about their social environment (social context). The combination of mobile and social environment results in a dynamically defined context, known as mobile social context. Personal information is highly related to the context of use, which is also true for its management activities. As the information needs of the users depend not only on mobile context but also on their social interactions, the aim of this PhD research was to create a model that uses the contextual information collected by mobile computing devices in order to improve the management of personal information. The stage of personal information management lifecycle on which this research had focused was exploitation. The case of mobile contacts was studied as a representative problem domain, because their number is constantly increasing, while users are reluctant to devote time and effort to organize or delete them and as the main mission of these devices in their most common form (Smartphones) is to facilitate communication. The goal of the research was to investigate in which way context can improve contact retrieval when starting a communication session, especially for the case of outgoing calls. However, the presented approach can be extended and applied to any other personal information element (e.g. messages, emails, notes, photos, video, etc.). The structure of this thesis is as follows: Initially, Chapter 1 introduces the reader to the problem of personal information management and analyzes the reasons why the studied problem shows an increased interest for the case of mobile computing devices. Next to linking the problem with mobile social context, the framework of the PhD research is presented: motivation, objectives and research questions. Chapter 2 presents an extensive literature review of related research activities for personal information management in mobile computing devices and use of context in general, and particularly for the case of mobile contacts. Chapter 3 proposes a model of context representation in the form of vector. Although this is a relatively simple representation, it allows for the easy context management and enables future integration of new dimensions. Moreover, it allows for the application of dimensionality reduction algorithms. A concept that was investigated was the reduction of the context dimensions to 2 or 3, a practice which would allow representation of personal information objects in two-dimensional or three-dimensional space and could possibly improve retrieval. Eventually, the idea was abandoned, as the number of adopted dimensions were not such as to justify the need for application of such techniques. In order to identify the context dimensions that are relevant to the problem of contact retrieval when starting a new call session, an experiment that was conducted and included analysis of real data from users’ devices is presented. The analysis identified two dimensions as important (frequency and recency of communication) and rejected others that are often used in literature, nevertheless without sufficient justification. Moreover, it revealed interesting communication patterns of the users, such as a form of Pareto Principle regarding the number of calls to contacts. Chapter 4 presents the algorithm that was developed for the retrieval, based on the ranking and selection of contacts using frequency and recency of communication. The algorithm, which operates as a prediction algorithm of the N contacts that are most likely for the user to call, was assessed by simulation on the available datasets. The results are more or equally successful than those that are reported in relevant research papers. In addition, some of the available algorithms in literature were implemented and were directly compared to the proposed algorithm, using the same dataset. This comparison resulted in much better performance of the proposed solution. Furthermore, three different types of users were identified according to their perceived “socialness”. For low or medium “social” users the performance of the algorithm is extremely high, while for more “social” users there is still room for improvement. In addition, in this chapter the results of a field experiment that was conducted to evaluate the algorithm under real conditions are presented, confirming the conclusions of the simulation procedure. Chapter 5 presents a study on the impact of location on contact retrieval. Location is considered as a very important context dimension and is very often suggested as a candidate dimension for call prediction in literature. Initially, physical location was analyzed, without finding a significant improvement in the prediction results when incorporating this dimension. Then, semantic location was also considered in the prediction algorithm, leading to similar conclusions. Similar conclusions resulted from the integration to the algorithm of contextual dimensions that are indirectly related to location, such as temporal context (time of day). Although we must be cautious in generalizing these findings, it seems that location is not such a useful context factor for many users regarding contact retrieval, as perceived in the scientific community. Finally, this thesis concludes with an epilogue where the conclusions are summarized, the research questions are answered and the contribution of the research is emphasized. At the same time, a generalization of the proposed model that can be applied to any type of personal information items or even to a combination of different types is presented.
περισσότερα