Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Von Textgeneratoren zu Intermedia-Präsentationssystemen

1993, Künstliche Intell.

Wahrend Textgeneratoren ausschlieslich auf das Medium Sprache zuruckgreifen, nutzen Intellimedia-Prasentationssysteme die individuellen Starken unterschiedlicher Medien, wie Text, Graphik, Gestik und Animation, fur die Informationsdarbietung. Die aus kommunikationstheoretischer Sicht allgemeinere Aufgabe wirft einerseits neue interessante Probleme auf, etwa die Selektion und die Koordination von Medien, fuhrt aber andererseits zu einer umfassenderen Behandlung von Fragestellungen, die bereits von der Textgenerierung her bekannt sind. Dieses Papier stellt die erste Generation von sprachverarbeitenden Intellimedia Prasentationssystemen vor, skizziert die neuen Problemstellungen und beschaftigt sich insbesondere mit der Frage, inwiefern sich Methoden zur Textgenerierung verallgemeinern lassen, damit sie fur die Informationsprasentation mit mehreren Medien anwendbar sind. While text generators exclusively rely on a single medium, intellimedia presentation systems take advantage of the i...

Deutsches Forschungszentrum fOr KOnstl iche Intelligenz GmbH Research Report RR-94-02 Von Textgeneratoren zu Intellimedia-Prasentationssystemen Elisabeth Andre , Thomas Rist February1994 Deutsches Forschungszentrum fur Kunstliche Intelligenz GmbH Postfach 20 80 67608 Kaiserslautem, FRG Tel.: (+49631) 205-3211/13 Fax: (+49631) 205-3210 Stuhlsatzenhausweg 3 66123 Saarbrilcken, FRG Tel.: (+49681) 302-5252 Fax: (+49681) 302-5341 Deutsches Forschungszentrum fur Kunstliche Intelligenz The German Research Center for Artificial Intelligence (Deutsches Forschungszentrum fOr KOnstliche Intelligenz, DFKI) with sites in Kaiserslautern and SaarbrOcken is a non-profit organization which was founded in 1988. The shareholder companies are Atlas Elektronik, Daimler-Benz, Fraunhofer Gesellschaft, GMD , IBM , Insiders , Mannesmann-Kienzle, SEMA Group, and Siemens. Research projects conducted at the DFKI are funded by the German Ministry for Research and Technology , by the shareholder companies , or by other industrial contracts. The DFKI conducts application-oriented basic research in the field of artificial intelligence and other related subfields of computer science . The overall goal is to construct systems with technical knowledge and common sense which - by using AI methods - implement a problem solution for a selected application area . Currently . there are the following research areas at the DFKI : o o o o o o Intelligent Engineering Systems Intelligent User Interfaces Computer Linguistics Programming Systems Deduction and Multiagent Systems Document Analysis and Office Automation. The DFKI strives at making its research results available to the scientific community. There exist many contacts to domestic and foreign research institutions, both in academy and industry. The DFKI hosts technology transfer workshops for shareholders and other interested groups in order to inform about the current state of research . From its beginning, the DFKI has provided an attractive working environment for AI researchers from Germany and from all over the world . The goal is to have a staff of about 100 researchers at the end of the building-up phase . Friedrich J. Wendl Director Von Textgeneratoren zu Intellimedia-Pdisentationssystemen Elisabeth Andre, Thomas Rist DFKI-RR-94-02 Die vorliegende Veroffentlichung erschien auch in KDnst/iche Intelligenz (KI) 2/93. Diese Arbeit wurde finanziell unterstUtzt durch das Bundesministerium fOr Forschung und Technologie (FKZ ITW-8901 8). © Deutsches Forschungszentrum fUr Kunstliche Intelligenz 1994 This work may not be copied or reproduced in whole or in part for any commercial purpose. Permission to copy in whole or in part without payment of fee is granted for nonprofit educational and research purposes provided that all such whole or partial copies include the following : a notice that such copying is by permission of Deutsches Forschungszentrum fUr Kunstliche Intelligenz, Kaiserslautern, Federal Republic of Germany; an acknowledgement of the authors and individual contributors to the work ; all applicable portions of this copyright notice. Copying, reproducing, or republishing for any other purpose shall require a licence with payment of fee to Deutsches Forschungszentrum fUr Kunstliche Intelligenz. Von 1extgeneratoren zu Intellimedia-Prasentationssystemen* Elisabeth Andre, Thomas Rist Deutsches Forschungszentrum fur Kunstliche Intelligenz (DFKI) Stuhlsatzenhausweg 3, D-66123 Saarbrucken Email: andre/rist@dfki.uni-sb.de 3. Marz 1994 Zusammenfassung: Wahrend Textgeneratoren ausschlieI31ich auf das Medium Sprache zuriickgreifen, nutzen Intellimedia-Prasentationssysteme die individuellen Starken unterschiedlicher Medien, wie Text, Graphik, Gestik und Animation, fiir die Informationsdarbietung. Die aus kommunikationstheoretischer Sicht allgemeinere Aufgabe wirft einerseits neue interessante Probleme auf, etwa die Selektion und die Koordination von Medien, fiihrt aber andererseits zu einer umfassenderen Behandlung von Fragestellungen, die bereits von der Textgenerierung her bekannt sind. Dieses Papier stellt die erste Generation von sprachverarbeitenden Intellimedia-Prasentationssystemen vor, skizziert die neuen Problemstellungen und beschaftigt sich insbesondere mit der Frage, inwiefern sich Methoden zur Textgenerierung verallgemeinern lassen, damit sie fiir die Informationsprasentation mit mehreren Medien anwendbar sind. Abstract: While text generators exclusively rely on a single medium, intellimedia presentation systems take advantage of the individual strength of several media, such as text, graphics, gestures and animations, to present information. On the one hand, new interesting problems arise in the broader context of multimedia communication, in particular the selection and the coordination of media. On the other hand, this research leads to a more general treatment of problems already known from text generation. The paper discusses the first generation of NL processing intellimedia presentation systems and sketches the new problems. Particular emphasis is given to the question of how to generalize methods for text generation in such a way that they become useful for the production of multimedia presentations, too. • Die vorliegende Arbeit wurde im Rahmen des vom BMFT geforderten Projekts WIP durchgefiihrt. 1 Inhaltsverzeichnis 1 Einfiihrung 3 2 Erste Protoypen 4 3 6 Zentrale Verarbeitungsprozesse 4 Ansatze zur Textgenerierung als methodologische Basis 4.1 Generierung von Text-Bild- Kombinationen als zielgerichtete Tatigkei t 4.2 Ein erweiterter Koharenzbegriff fiir Text-Bild-Kombinationen . 4.3 Ansatze zur Strukturierung von Text-Bild-Kombinationen . . . . . . 7 7 8 10 5 Medienkoordination 5.1 Auswahl von Prasentationsmedien . . . . . . . . . . . . . . . . 5.2 Generierung von Querverweisen und multimedialen Referenzen 5.3 Raumliche und zeitliche Koordination der Ausgabe . . . . . . 11 6 15 Aufbau von IMP-Systemen 7 SchluBbemerkung 12 13 15 17 2 1 Einfiihrung Multimedia-Systeme, in denen unterschiedliche Medien wie beispielsweise Graphik, Sprache, Musik und Animation zur Informationsprasentation zur Verfiigung stehen, sind seit Ende der 80er Jahre unaufhaltsam auf dem Vormarsch. Ein Gang iiber eine beliebige Computerfachmesse zeigt, daB immer mehr Anbieter Multimedia-Systeme in ihre Angebotspalette aufnehmen und eingefiihrte Produkte urn gewisse Multimedia-Funktionen erweitern. Solche Funktionen umfassen die Darstellung, Speicherung, Verbreitung bis hin zur Erzeugung und Verarbeitung multimedialer Dokumente. Fiir die Informationsprasentation bietet die Unterstiitzung mehrerer Medien nicht nur Wahlmoglichkeit, sondern vor allem auch Kombinierbarkeit. Multimedia-Systeme sind besonders dann attraktiv, wenn sich Information erst durch eine geschickt gewahlte Kombination mehrerer Medien effektiv darbieten laBt, wobei unter Effektivitat leicht verstandlich, schnell wahrnehmbar, einpragsam, ansprechend usw. zu verstehen ist - je nach Zweck einer Prasentation. lntelligente Priisentationssysteme als Komponenten von Benutzerschnittstellen zu Hilfesystemen, Expertensystemen oder intelligenten Betriebswarten del' nachsten Generation zielen darauf ab, vorliegendes Wissen benutzerspezifisch und der jeweiligen Prasentationssituation angemessen auszuwahlen und darzubieten. Dies setzt ein hohes Mal3 an Flexibilitat bei der Informationsprasentation voraus; unterschiedliche Benutzer in unterschiedlichen Situationen erfordern fast immer unterschiedliche Prasentationen. Weil es im allgemeinen ext rem aufwendig - wenn nicht gar unmoglich - ist, potentielle Benutzer und Prasentationssituationen vollstandig zu antizipieren und dafur entsprechende Prasentationen vorzubereiten, ist es naheliegend, diese erst bei Bedarf unter Beriicksichtigung der aktuellen Gegebenheiten zu erzeugen. Diesel' Gedanke fiihrt zum intelligenten, im Idealfall universell einsetzbaren Prasentationsexperten, del' neben fachspezifischem Prasentationswissen iiber grundlegende kommunikative Fahigkeiten verfiigt. Ein solches Prasentationssystem ware sowohl fiir den Benutzer als auch fiir den Ersteller einer Anwendung vorteilhaft. Wahrend der Benutzer auf ihn individuell abgestimmte Prasentationen erwarten darf, wird der Ersteller wesentlich entlastet, da er sich auf die eigentlichen Probleme der Anwendung konzentrieren kann. Intellimedia-Priisentationssysteme (IMP-Systeme) stehen fiir den Versuch, MultimediaTechnologie ftir eine intelligente Informationsprasentation zu nutzen. Dazu geniigt es alb-dings nicht, eine Workstation mit den technischen Notwendigkeiten fiir den Einsatz multipler Medien auszurtisten. Die Schwierigkeit besteht vielmehr darin, die individuellen Starkcn del' zur Verfiigung stehenden Medien geschickt einzusetzen und unterschiedliche Medien in einer Multimedia-Prasentation in konsistenter und koharenter Weise zu integrieren. DaB es sich hierbei keinesfalls urn eine triviale Aufgabe handelt, laBt sich anhand zahlreicher mehr oder weniger miBgliickter Multimedia-Prasentationen belegen. Zu den Beispielen zahlen gedruckte illustrierte Gebrauchsanweisungen, in denen Bilder nichts zum Verstandnis beitragen, wenn nicht gar Verwirrung stiften, ebenso wie die vielen, aufwendig gestalteten Computerprasentationen, die den Benutzer letztendlich einer nicht zu bewaltigcnden Reiziiberftutung aussetzen. Urn die zur Verfiigung stehenden Medien 3 optimal einsetzen zu konnen, muB ein IMP-System zum einen die medienspezifische Enkodierung von Information beherrschen - tritt also sowohl als Textautor, Graphikdes igner, Drehbuchautor, Komponist usw . in Erscheinung. Zum anderen kommt ihm die Rolle des Medienkoordinators zu, der iihnlich einem Desktoppublisher verschiedene Medien in einem Dokument integriert . Aus der Sicht der Textgenerierung sind IMP-Systeme aus zwei Grlinden interessant. Zum einen macht Sprache als eines der wichtigsten Kommunikationsmedien Textgeneratoren zu unentbehrlichen Komponenten von IMP-Systemen. Zum anderen haben Verfahren zur Textgenerierung zunehmend an Reife gewonnen, so daB es erfolgversprechend ist , zu untersuchen, inwiefern sich die dort entwickelten Ansatze auch fur den allgemeineren Fall der Informationspriisentation mit mehreren Medien libertragen lassen. In den letzten Jahren wurden in einer Reihe von Projekten ausgehend von Fragestellungen der Textgenerierung Systeme entwickelt, die neben Sprache auch Medien wie Graphik, Gestik und animierte Darstellungen heranziehen. 2 Erste Protoypen Aus funktionaler Sicht liiBt sich jedes der bisher entwickelten sprachverarbeitenden IMPSysteme in das in Abbildung 1 gezeigte allgemeine Schema einpassen. Aufgabe eines IMP-Systems ist es, die von einer Anwendung bereitgestellte Information (Pfeil a) einem(r) Benutzer(gruppe) zu libermitteln (Pfeil b), wobei dem System unterschiedli che Medien zum Aufbau von Priisentationen zur Verfligung stehen. Die einzelnen Systeme sind zuniichst einmal hinsichtlich der vorgesehenen Anwendung voneinander zu unterscheiden. Zum einen gibt es Systeme, die als Informationssystem konzipiert sind. Hierzu ziihlen: ALFresco [Stock 91], das dem Benutzer Information liber italienische Fresken vermittelt, das von Kerpedjiev (vgl. [Kerpedjiev 92]) entwickelte System zur Priisentation meteorologischer Daten, die Dokumentationssysteme EDWARD [Claassen 92], IDAS (Intelligent Documentation Advisory System, [Reiter et al. 92]) und IGiNG (Integrating Graphics and Natural Language Generation, [Dilley et al. 92]), die Auskunft iiber Dateien, Rechneranlagen oder Konferenzen geben, das kartographische Informationssystem 12 (Integrated Interfaces, [Arens et al. 91]) sowie die Wegauskunftssysteme AIMI (vgl. [Maybury 91]) und VITRA-GUIDE (vgl. [Herzog et al. 93]). Zum anderen wurden Systeme als Schnittstellen zu Experten- oder Hilfesystemen entwickelt. XTRA (eXpert TRAnslator, [Allgayer et al. 89]) ist ein Zugangssystem zu einem Expertsystem, das den Benutzer beim Ausflillen eines Steuerformulars unterstiitzt. CUBRIC ON (the CUBRC Intelligent CONversationalist, [Neal & Shapiro 91]) ist als intelligente Benutzerschnittstelle zu einem militiirischen Planungssystem konzipiert. COSPS [Marks 91J und SAGE (a System for Automatic and Graphical Explanation, [Roth et al. 91]) generieren Erkliirungen fiir quantitative Modelle, z.B. im Bereich Projektmanagement oder im Finanzwesen . MMI2 (A Multi-Modal Interface for Man Machine Interaction with Knowledge-Based Systems, [Wilson et al. 92]) ist eine 4 Anwendungssystem (z.B. Datenbank. Hilfe- . Expertensystem IntellimediaPrasentationssystem Medium-l (z.B. Text • • • Medium-n z.B. Graphik) Multlmedla- . Prasentatio Abbildung 1: Schema fur IMP-Systeme Schnittstelle zu einem Konfigurierungssystem von Computernetzwerken. PEA (Program Enhancement Advisor, [Moore & Swartout 90]) ist mit einem Expertensystem gekoppelt, das Vorschlage zur Optimierung von Lispprogrammen liefert. COMET (COordinated Multimedia Explanation Testbed, [Feiner & McKeown 91]) und \VIP (Wissensbasierte Informationsprasentation [Wahlster et al. 91; Wahlster et al. 92; vVahlster et al. 93; Andre et al. 93al) ubermitteln Instruktionen fur die Montage, Bedienung und Reparatur technischer Gerate, wobei vorgesehen ist, daB die mitzuteilende Information von einem Diagnose- oder Hilfesystem bereitgestellt wird. Ein augenscheinliches Vergleichskriterium sind die von den Systemen untersti.itzten Prasentationsmedien. Neben statischen Medien wie Text und Graphik, die in allen Systemen in irgendeiner Form zum Einsatz kommen, werden in einigen Systemen auch dynamische Medien unterstutzt. Beispielsweise prasentiert ALFresco dem Benutzer Information uber italienische Fresken nicht nur durch Einzelbilder, sondern auch durch kurze Videosequenzen . Die Generierung von animierten Darstellungen wird u.a. fi.ir die Systeme VITRA-GUIDE und eine Erweiterung von COMET angestrebt. Je nachdem ob Interaktion zwischen Prasentationssystem und Benutzer bzw. einem Anwendungssystem vorgesehen ist, sind Pfeil c bzw. Pfeil d instantiiert (vgl. Abbildung 1). Die Systeme XTRA, CUBRICON, ALFresco, MMI2, 12, PEA und IDAS verfugen sowohl uber eine Generierungs- als auch eine Analysekomponente. U m komplizierte Referenzprobleme bei der Analyse von naturlicher Sprache zu umgehen, wurde fur die Systeme .5 12 , PEA und IDAS keine naturlichspraehliehe Analysekomponente entwiekelt. Stattdessen werden dem Benutzer Menus oder sogar hypertext-ahnliehe Sehnittstellen angeboten. Untersehiede sind auch hinsichtlieh der Fahigkeit festzustellen, ein und dieselbe Information in Abhangigkeit untersehiedlieher Generierungsparameter (Pfeil e) situationsgerecht zu prasentieren. Beispielsweise konnen im WIP-System Generierungsparameter wie Zielsprache (englisch/deutsch), Benutzergruppe (Experte/Laie) und Dokumenttyp (Handbueh/Bildschirmprasentation) vor dem PrasentationssyntheseprozeB eingestellt werden. Desweiteren sind gravierende Unterschiede in Bezug auf die zugrundeliegenden Ver- arbeitungsprozesse und Systemarchitekturen auszumaehen. Hierauf wird in den naehfolgenden Kapiteln naher eingegangen. 3 Zentrale Verarbeitungsprozesse Der Weg von einem kommunikativen Ziel bis hin zur Multimedia-Prasentation laBt sieh in mehrere Arbeitschritte unterteilen. Zu den grundlegenden Aufgaben, die ein IMP-System zu bevvaltigen hat, zahlen: • Festlegung und Strukturierung des Inhalts Hier ist zu unterscheiden, ob das Anwendungssystem den Inhalt mehr oder \veniger vorgibt, so daB dieser "nur" noch zu strukturieren ist, oder ob ausgehend von einem kommunikativen Ziel die mitzuteilende Information aus einer Wissensbasis ausgewahlt werden muB. Was prasentiert wird, hangt nieht zuletzt auch von dem gewahlten Prasentationsmedium abo Wahrend Spraehe zahlreiehe Abstraktionsmogliehkeiten bietet, ist ein Prasentator bei der bildlichen Wiedergabe von Information oftmals gezwungen, diese zu konkretisieren. Ebenso wie die Inhaltsauswahl ist aueh die Strukturierung einer Multimedia-Prasentation nieht unabhangig von dem gewahlten Medium zu sehen . • Koordinierte Verteilung der Information auf die versehiedenen Medien Urn untersehiedliehe Medien so zu kombinieren, daB ihre individuellen Starken optimal genutzt werden, miissen geeignete Kriterien gefunden werden, nach denen die mitzuteilende Information auf unterschiedliehe Generatoren verteilt wird. Hierbei gilt es auch, das richtige MaB an Komplementaritat und Redundanz zwischen den verwendeten Prasentationsmedien zu finden. Eine komplementar gestaltete Prasentation, die keinerlei redundant kodierte Information enthalt, wirkt meist inkoharent. Wird dagegen zuviel in unterschiedlichen Medien "paraphrasiert", besteht die Gefahr, daB sich der Benutzer nach ktll·zer Zeit auf ein Medium konzcntrieri und moglieherweise Information iibersieht. • Medienspezifisehe Inhaltsrealisierung Hierunter falIt die Realisierung der mitzuteilenden Information dureh die unter- 6 schiedlichen Generatoren, wobei die Generierungsergebnisse so aufeinander abzustimmen sind, daB sich die Medien in ihrer Wirkung gegenseitig verstiirken. Beispiels weise ist darauf zu achten, daB die Ergebnisse del' einzelnen Genel'atol'en strukturell vel'triiglich sind und daB auf die Ergebnisse anderel' Generatoren Bezug genommen wird . • Integration der Generierungsergebnisse in einer Ausgabe Wiihrend das Layout bei der Textgenerierung bisher weitgehend vernachliissigt wurde, wird es in IMP-Systemen als wichtiger Informationstriiger genutzt. Liegen die Ergebnisse unterschiedlicher Generatoren vor, miissen diese unter Beriicksich tigung riiumlicher und zeitlicher Constraints in einer multimedialen Ausgabe integriert und dem Benutzer priisentiert werden . 4 Ansatze zur Textgenerierung als methodologische Basis Obwohl die Generierung von Multimedia-Priisentationen neue Probleme aufwirft, fiillt eine groBe Ahnlichkeit zu Fragestellungen auf, die bereits in mehreren Arbeiten zur Textgenerierung thematisiert wurden. Hierzu ziihlen Verfahren zur Planung des Inhalts und del' Struktur von Texten. 4.1 Generierung von Text-Bild-Kombinationen als zielgerichtete Tatigkeit A lIsgehend von einer sprechakttheoretischen Sichtweise wird nicht nur die Generierung von Texten, sondern allgemein die Generierllng von Multimedia-Priisentationen als kommunikative Handlllng zur Erl'eichung von Zielen aufgefafit. In [Andre & Rist 90b] wurde dieser Ansatz erstmals fiir die Generierung von Text-Bildkombinationen ausgearbeitet. Kommunikative Handlungen kannen sich wiederum aus anderen kommunikativen Handlungen zusarnmensetzen. Die Bliitter der entstehenden hierarchischen Stl'uktur sind element are Sprechakte (vgl. [Searle 80l) oder Bildakte (vgl. [Kjorup 78]). Beispiele fiir Sprechakte sind 8ehaupten, AuiJordern oder Bitten, wiihrend Handlungen wie Annotieren, Darstellen oder Hervorheben zu den Bildakten ziihlen. Durch die mit den einzelnen Handlungen assoziierten Ziele ergibt sich neben einer hierarchischen Handlungsstruktur auch eine hierarchische Struktur von Zielen (intentionale Struktur). Dabei tragen die Handlungen, die zur Erreichung eines untergeordneten Ziels dienen, zur Erreichung iibergeordneter Ziele bei. Abbildung 2 zeigt einen aus einer Bedienungsanleitung entnommenen Dokumentausschnitt und die ihm zugrundeliegende intentionale Struktur. Mit dies em Dokumentallsschllitt so il erreicht werden, daB der Benlltzer die Verschlufikappe eines Wasserbehiilters cnLi'crnt. Dieses Ziel spiegelt sich im wesentlichen durch die verbale Aufforderung "Ent('emen Sie die VerschluBkappe" wider. Aufgrund del' Aufforderung weifi der Benutzer, daB der Prasentator macht.e, daB er die VerschluBkappe entfernt. Ob er jedoch dazu in del' Lage ist oder den Wiinschen des Prasentators nachkommen machte, ist damit nicht unbedingt 7 sichergestellt. Diese beiden Ziele sollen durch das Bild und die verbale AuBerung "urn den Wasserbehalter zu flillen" erreicht werden. Auch den einzelnen Bildteilen konnen bestirnrnte Ziele zugeordnet werden. Beispielsweise so11 durch die beiden Pfeile sichergestellt werden, daB der Benutzer den Bewegungsverlauf der von ihm auszuflihrenden Handl ungsschri t te kennt. (Done User remove-I) (Bel User (Goal System (Done User remove-I))) (Cando User remove-I) (Goal User (Done User remove-I» (Bel User (Step remove-I fiU-i) (Bel User (Causes remove-l state-I» Elllfernen Sie die Verschluj1kappe; um den Wasserbehillter ZJJ fii/len! I c:> (Cando User identify-cover-I) (Bel User (plan remove-l seauence·turn·lift·l )) (Bel User (Trajectory turn· 1 traj·turn-l» I I (Bel User (Trajectory lift· 1 traj-lift-l» I c.....,..- t I "um dell Wasserbehillter ZJJ filllell ,,' ~ Abbildung 2: Intentionale Struktur eines Dokumentausschnitts 4.2 Ein erweiterter Kobiirenzbegriff fur Text-Bild-Kombinationen Mehrere Textlinguisten haben Koharenz durch Relationen zwischen einzelnen Diskurssegmenten charakterisiert (vgl. [Grimes 75; Hobbs 78; Mann & Thompson 87]) . Ein Text wird nur dann als koharent betrachtet , wenn er in Segrnente zerlegt werden kann, die durch bestimmte Relationen miteinander verbunden sind. Beispielsweise haben Mann und Thompson ausgehend von einer urnfangreichen Analyse der rhetorischen Struktur koharenter Texte etwa 25 solcher Relationen identifiziert, die die Grundlage der von ihnen entwickelten Rhetorical Structure Theory (RST) bilden. Zu den RST-Relationen zahlen beispielsweise Enablement, Nlotivation, Condition oder Elaboration. 1m Hinblick auf einen verallgemeinerten Koharenzbegriff stellt sich die Frage, welche Beziehungen zwischen den Dokumentteilen einer koharenten multimedialen Prasentation bestehen. In kognitionspsychologischen Arbeiten wurde untersucht, welche Rolle ein bestimmtes Bild in Bezug auf eine begleitende Textpassage spielt. Beispielsweise hat Levin [Levin et al. 87] funf Grundfunktionen von Bildern erkannt: Representation, Organization, Interpretation, Transformation und Decoration. Bei der Untersuchung von Lehrbuchern schrieben Hunter und Kollegen (vgl. [Hunter et al. 87]) Bildern vor allem die Funktionen Embellish, Reinforce, Elaborate, Summarize und Compare zu. Bandyopadhyay [Bandyopadhyay 90] 8 unternahm den Versuch, die von Hobbs [Hobbs 7S] vorgeschlagenen Koharenzrelationen auf Bilder zu ubertragen. Leider sind die von den Text-Bild-Forschern vorgeschlagenen Definitionen sehr allgemein gehalten. Daruberhinaus wird nur die Funktion von ganzen Bildern betrachtet, d.h. es wird nicht untersucht, aus welchen Teilen sich ein Bild zusammensetzt und welche Rolle diese fur die Gesamtinterpretation spielen. Urn jedoch eine vollstandige Beschreibung der gesamten Prasentationsstruktur zu erhalten, rnussen auch die Beziehungen zwischen einzelnen Bildteilen und zwischen Bildteilen und Text explizit reprasentiert werden. Untersuchungen illustrierter Dokurnente (vgl. [Andre & Rist 93; Arens et al. 93b; Roth & Mattis 90]) zeigen, daB sich Beziehungen zwischen Bildern/Bildteilen untereinander und zwischen Bildern/Bildteilen und Text oft durch die von Textlinguisten gefundenen Relationen beschreiben lassen. Beispiele sind Elaboration bei Haupt- und Nebenbildern, Sequence bei Bildfolgen oder Interpretation bei einem Bild und der dazugehorigen Erklarung irn Text. Andererseits gibt es Relationen, wie beispiels\veise Concession oder Condition, die nicht ohne wei teres bildlich ausdruckbar sind. Schlie51ich treten Relationen auf, die in keiner der oben angegebenen Arbeiten zur Textkoharenz zu finden sind, etwa die Relation Label zwischen einern Text und seinern Titel oder zwischen Bildobjekten und ihrer Beschriftung. Instruct Request Enable I "Entfemen Sie die VerschllljJkoppe" ~ Inform-Cause-Result Describe-State Entfernen Sie dle VerschilljJkoppe, urn den Wasserbe· hiiller zu fiillen! Motivate . Provlde·Backgrou nd ~ Describe-Action : ~l!: Describe-Trajectory I c......... "tun den Wasserbehiilter zu fiil/en" I Describe-Trajectory I t Abbildung 3: Rhetorische Struktur des Dokurnentausschnitts aus Abbildung 2 Abbildung 3 zeigt die rhetorische Struktur des Dokurnentausschnitts aus Abbildung 2. Das Dokurnent setzt sich zusarnrnen aus einer Aufforderung, einern Motivationsteil und einern Teil, der die Ausfuhrung der Handlung errnoglichen solI. Auch den einzelnen Bildteilen konnen unterschiedliche rhetorische Funktionen zugeordnet werden. Beispielsweise 9 dient die Darstellung der Espressomaschine als Hintergrund fiir den Rest des Bildes . 4.3 Ansatze zur Strukturierung von Text-Bild-Kombinationen Wie in den vorangegangenen Abschnitten dargelegt, folgen Bilder und Text-Bild-Kombinationen ahnlichen Strukturierungskriterien wie Text. Insbesondere ist eine Text-BildKombination charakterisiert durch ihre intentionale Struktur, die die Ziele des Prasentators widerspiegelt, und ihre rhetorische Struktur, die durch rhetorische Relationen bestimmt wird. Es bietet sich daher an, Ansatze zur Textstrukturierung nicht nur zur Organisation der textuellen Teile einer multimedialen Prasentation, sondern zur Strukturierung der gesamten Prasentation zu verwenden. Ein wesentlicher Vorteil eines einheitlichen Strukturierungsansatzes ist darin zu sehen, dafi nicht nur Beziehungen innerhalb eines Mediums, sondern auch Beziehungen zwischen Teilen in unterschiedlichen Medien explizit reprasentiert werden konnen. In Systemen wie SAGE [Roth et al. 91], in den~ medienspezifische Verfahren zur Inhaltsstrukturierung zum Einsatz kommen, geht hingegen der Zusammenhang zwischen Text und Graphik verloren. In COMET werden zur Strukturierung der Gesamtprasentation Schemata verwendet (vgl. [McKeown et al. 90]), die McKeown urspriinglich zur Strukturierung von Texten (vgl. [McKeown 85]) entwickelte. Schemata beschreiben den prototypischen Aufbau von Prasentationen mit Hilfe von rhetorischen Pradikaten, die die Beziehungen zwischen den Teilen einer Prasentation reprasentieren. Beim Aufbau einer Multimedia-Prasentation wird ausgehend von einem Prasentationsziel (z.B. 'der Benutzer solI wissen, wie man ein bestimmtes Gerat bedient') ein Schema selektiert . Wahrend der Traversierung des Schemas wird Information aus einer Menge von vorselektierten Propositionen ausgewahlt. Das Ergebnis wird dann an einen Mediakoordinator iibergeben, der fiir die einzelnen Teile bestimmt, welcher Generator sie verarbeiten solI. Schemata konnen als das Ergebnis eines Kompilierungsprozesses aufgefafit werden, bei dem nur noch das iibergeordnete Ziel und die einzelnen Schritte zur Erreichung dieses Ziels iibrigbleiben. Welchen Effekt einzelne Teile eines Schemas auf den Benutzer haben und in welcher Beziehung diese Teile zueinander stehen, wird nicht explizit reprasentiert. Aus diesem Grund stellen Schemata ein effizientes Mittel zur Dokumentstrukturierung da.r. Probleme treten jedoch auf, wenn der Benutzer eine Systemaufierung nicht versteht. Auf Schemata basierende Systeme haben dann nur noch die Moglichkeit, ein anderes Schema auszuwahlen. Sie sind nicht in der Lage, nur auf einen Teil des zum Schema korrespondierenden Textes oder Bildes naher einzugehen (siehe auch [Paris 91]). Neben schemabasierten Ansatzen werden bei der Synthese multimedialer Dokumente planbasierte Ansatze verwendet, die auf Erweiterungen von Textplanungsansatzen (vgl. [Moore & Paris 89; Maybury 89]) beruhen. Urn multimediale Prasentationen zu pla.nen, fafit man die zu Beginn dieses Kapitels eingefiihrten kommunikativen Handlungen als 10 Operatoren eines Planungssystems auf. Beim PlanungsprozeB wird ausgehend von einem kommunikativen Ziel, z.B. der Benutzer soll in der Lage sein, eine bestimmte Aktion auszufiihren, nach Planungsoperatoren gesucht, deren Effekt dieses Ziel subsumiert . Wird ein solcher Planungsoperator gefunden, so werden die Ausdriicke im Rumpf als neue Teilziele bearbeitet. Handelt es sich dabei urn element are Sprechakte oder Bildakte, so werden diese an die medienspezifischen Generatoren iibergeben. Wie in [Moore & Paris 89] gezeigt wurde, ermoglichen es planbasierte Ansatze, sowohl die Intention, die ein Sprecher mit einer AuBerung verfolgt, als auch die rhetorischen Beziehungen zwischen AuBerungen aufzuzeichnen, vorausgesetzt es werden entsprechende Planoperatoren definiert, die intention ale mit rhetorischen Zielen in Verbindung bringen. Prasentationen lassen sich dadurch individuell auf einen Benutzer abstimmen. Beispielsweise konnte man in dem Dokumentausschnitt aus Abbildung 2 das Bild weglassen, falls sichergestellt ist, daB der Benutzer weiB, wo sich die VerschluBkappe befindet und wie sie ZlI entfernen ist. Dariiberhinaus lassen sich Teile einer Prasentation nachbessern, falls sich hcrausstellt, daB diese fiir den jeweiligen Benlltzer unverstandlich sind. Teilt del' Benutzer, nachdem ihm der Dokllmentausschnitt aus Abbildung 2 prasentiert wurde, dem System mit, daB er die Verschluf3kappe nicht finden kann, so konnte das System versuchen, das Objekt durch bestimmte Merkmale eindeutig zu charakterisieren, und z.B. einen Satz wie "Die VerschluBkappe ist die rote Kappe links unter dem Deckel" generieren. Bei einem schemabasierten Ansatz kann das System zwar ein neues Schema auswahlen, urn dem Benutzer das Auffinden der VerschluBkappe zu ermoglichen. Es kann jedoch passieren, daB wieder ein Bild generiert wird, da das System nicht in der Lage ist, zu erkennen, daB dieses Ziel bereits als Teilziel bearbeitet wurde und ein Bild nicht zum Erfolg fiihrte. Planungsbasierte Ansatze fiir die Synthese multimedialer Dokumente werden u.a. in den Systemen WIP [Andre & Rist 90b] und AIMI [Maybury 91] verwendet. Wahrend jedoch in [Maybury 91J die Mediumselektion erst an den Blattern des entstehenden Baumes erfolgt, konnte in [Andre & Rist 93J gezeigt werden, daB es Planer dieses Typs ermoglichen, gleichzeitig Inhalte auszuwahlen, zu strukturieren und auf die medienspezifischen Generatoren zu verteilen, wenn die Planoperatoren entsprechende Constraints ftir die MedilImselektion enthalten. 5 Medienkoordination Urn zu verhindern, daB die Ergebnisse der verschiedenen Generatoren beziehungslos nebeneinander stehen, diirfen die Generatoren nicht isoli ert voneinander betrieben werden. Es reicht also nicht, unterschiedliche Generatoren zu einem IMP-System zusammenzufassen, man muB deren Arbeit auch koordinieren . Hierunter niJlt die Verteilung der Information auf verschiedene Generatoren, die Verzahnung der einzelnen Generierungsprozesse sowie die Integration der Generierungsergebnisse in einer multimedialen Ausgabe. 11 5.1 Auswahl von Prasentationsmedien Ausgehend von der Frage, welches Medium oder welche Medienkombination welche Art von Information am besten ubertragt, wird in den meisten Ansatzen die zu prasenti erende Information nach verschiedenen Gesichtspunkten klassifiziert. Beispielsweise geht COMET von sechs Informationstypen (location, physical attributes, abstract actions, connectives, simple and compound actions) aus (vgl. [Feiner & McKeown 91]). Fur raumliche Information und physikalische Attribute ist als Prasentationsmedium Graphik vorgesehen,wahrend fur abstrakte Aktionen und Konnektiva Text verwendet wird . Zur Prasentation von einfachen und zusammengesetzten Aktionen werden beide Medien herangezogen. Eine feinere Klassifikation wird im WIP System verwendet (vgl. [Andre & Rist 93]). Dort stehen insgesamt sieben Informationstypen (concrete, abstract, spatial, covariant, temporal, quantification, negation) mit bis zu zehn Untertypen zur Verfiigung. Desweiteren wird zwischen zehn kommunikativen Funktionen (attract-attention, compare, elaborate, enable, elucidate, lab el, motivate, evidence, background, summarize) unterschieden, die ebenfalls di e Mediumselektion beeinflussen. Statt Informationstypen bestimmten Medien zuzuordnen, besteht di e Mogli chkeit , sowohl die Information als auch die zur Verfiigung stehenden Medien und Prasentationstechniken nach bestimmten Merkmalen zu charakterisieren und die Auswahl der Medien uncl der Prasentationstechniken auf der Grundlage dieser Klassifikation durchzufiihren. Diese Vorgehensweise wurde von Bertin [Bertin 67] fiir die Gestaltung von Graphiken gewahlt, dann von Mackinlay [Mackinlay 86] und spater von Roth [Roth et al. 91] hir die automatische Generierung von Geschaftsgraphiken aufgegriffen. In [Arens et al. 93b] wird eine ahnliche Vorgehensweise nicht nur fiir die Auswahl von Prasentationstechniken, sondern auch fiir die Mediumselektion eines IMP-Systems vorgeschlagen. Die fiir die Auswahl relevante Information wird dabei in einem Und-Oder-Abhangigkeitsnetzwerk dargestellt. Aufgrund der wenigen Merkmale, anhand derer die Medien klassifiziert werden, benotigt aber auch dieser Ansatz bei der Generierung speziellere Auswahlregeln (vgl. [Vossers 91]) wie sie etwa in WIP und COMET Verwendung finden. Wahrend fur die Auswahl zwischen Text und Graphik bisher nur einfache Heuristiken bekannt sind, liegen fiir die Auswahl zwischen mehreren Prasentationstechniken bereits auf tieferen Inferenzen beruhende Ansatze vor. Beispielsweise wircl in clem System APT [Mackinlay 86] bei cler Auswahl von Prasentationstechniken anhancl von formalen Kriterien gepriift, welche Information durch eine spezielle Prasentationstechnik vermittelt werden kann (J(riterium der Expressivitiit) und wie wirkungsvoll diese Tcchnik di e zu iibermittelnde Information prasentiert (J( rite7'ium der Effektivitiit). Casner [Casner 91] beschreibt einen Ansatz, bei dem die Selektion von Prasentationstechniken auf der Gruncllage von perzeptuellen Faktoren erfolgt. Das von ihm entwickelte System BOZ analysiert zunachst die yom Benutzer durchzufiihrende Aufgabe (z .B. Temperaturunterschiede zu erkennen) und formuliert eine entsprechende perzeptuelle Aufgabe (z.B. Langenunterschiede zu erkennen), indem die logischen Operatoren in der Aufgabenbeschreibung durch perzep- 12 tuelle Operatoren ersetzt werden. Anschlie13end wird eine graphische Darstellung entworfen, die die Daten in der Graphik so strukturiert, da13 sie aIle erforderlichen perzeptuellen Operatoren unterstiitzt und gleichzeitig die visuelle Suche minimiert. Zusammenfassend la13t sich sagen, daB in den meisten Systemen die Mediumselektion in erster Linie yom Informationstyp abhangt. Weitere Faktoren sind die Ziele des Prasentators, Betriebsmittelbeschrankungen, Benutzerklasse und Benutzeraufgabe. Schwierig wird der Auswahlproze13 vor aHem dann, wenn sich mehrere Faktoren gegenseitig beeinflussen. Beispielsweise stellten Bieger und Glock [Bieger & Glock 86] in einem Performanztest fest, da13 Versuchspersonen Instruktionen zwar schneller verstehen, wenn raumliche Information graphisch dargestellt wird, den Versuchspersonen jedoch mehr Fehler unterlaufen als bei rein text uellen Prasentationen. In diesem Fall ware zumindest eine Gewichtung der Ziele des Prasentators erforderlich. 5.2 Generierung von Querverweisen und multimedialen Referenzen Urn Prasentationen koharent zu gestalten, mussen die einzelnen Generatoren ihre Ergebnisse aufeinander abstimmen. Wichtige Beispiele hierfur sind Querverweise und multimediale ReJerenzen. Querverweise wie "der linke Bildteil" oder "Abbildung x" stellen Verbindungen zwischen Dokumentteilen in unterschiedlichen Medien her und tragen damit wesentlich zur Koharenz einer Multimedia-Prasentation bei. Eine multimediale Referenz liegt vor, wenn auf mehr als ein Medium zuruckgegriffen wird, urn auf eine Entitat der Diskurswelt zu verweisen . Typische Beispiele sind natiirlichsprachliche Au13erungen der Form "die im Bild grtin markierte Schraube" oder von natlirlichsprachlichen Au13erungen begleitete Zeigegesten. Wird unter Verwendung verschiedener Medien auf die frlihere Darstellung einer Ent iUit Bezug genommen, so handelt es sich urn einen multimedialen QuenJenveis. In den meisten Fallen wird von Text auf Graphik oder andere Textteile verwiesen, jedoch auch mit Hilfe graphischer Mittel lassen sich Querverweise realisieren. Beispiele hierflir sind Pfeile, die von einem Bildteil zum entsprechenden Text zeigen. Multimediale Referenzausdriicke bieten die Moglichkeit, zusatzliche Attribute zur Abgrenzung eines Obj ekts von seinen Alternativen zu verwenden. Hierunter fallen Attribute des Objekts im Bild, deren Interpretation sowie die raumliche Lage des Obj ekts relativ zum Bild oder zu anderen Bildobjekten. Wird auf die Interpretation eines Bildattributs vcrwiesen, so mu13 sichergestellt sein, da13 der Benutzer diese kennt. Beispielsweise wird ein Ausdruck der Form "der Flu13 oben links auf der Karte" nur dann verstanden, wenn der Benutzer in der Lage ist, bestimmte Bildteile als FluBdarstellungen zu erkennen. Darliberhinaus sollte aus dem Kontext eindeutig hervorgehen, ob es sich bei den verwendeten Attributen urn Welt- oder Bildattribute handelt. Verwirrung beim Benutzer konnte insbesondere dann entstehen, wenn sich Welt- und Bildattribute widersprechen. I-Iaufig werden bei der Generierung von Querverweisen und multimedialen Referenzen 13 raumliche Relationen verwendet. Da sich sowohl die Anordnung von Bildobjekten als auch die Anordnung von Textblocken und Bildern nicht vorhersehen laBt, ist es unmoglich, raumliche Relationen vorab in einer Wissensbasis abzulegen. Einige IMP-Systeme wie COMET und WIP verfiigen daher iiber Lokalisierungskomponenten, urn die Lage von Bildobjekten absolut im Bild (absolute Lokalisation) oder relativ zu anderen Bildobjekten (relative Lokalisationen) zu berechnen. Neben elementaren (z.B. "der Knopf links im Bild") konnen mit diesen Komponenten auch zusammengesetzte Lokalisationen (z.B. "der Knopf oben links im Bild") generiert werden. 1m Gegensatz zu COMET [McKeown et al. 92] werden in WIP Objekte auchin Bezug auf Bildteile (z.B. die Ecken) oder Objektgruppen lokalisiert (vgl. [Wazinski 91; Wazinski 92]). Eine wichtige Voraussetzung fiir die Generierung von Querverweisen ist die explizite Reprasentation des sprachlichen und des piktoriellen Kontextes. 1m System CUBRICON [Neal & Shapiro 91] ist der sprachliche Kontext durch eine Fokusliste von Entitaten und Propositionen repasentiert, auf die sprachlich oder mit Hilfe von Zeigegesten verwiesen wird. Zur Reprasentation des piktoriellen Kontext wird ein Display-Modell verwend'e t, das dariiber Buch fiihrt, weIche Entitaten sichtbar sind, in weIchem Fenster sie sich befinden und welche Fenster auf dem Bildschirm zu sehen sind. Auch XTRA reprasentiert nicht nur den sprachlichen Kontext, sondern verwaltet auch eine Datenstruktur fiir die Graphik, auf die wahrend des Dialogs Bezug genommen wird (vgl. [Reithinger 92bl). In der Steuerdomane ist dies eine Formularhierarchie, die die Positionen und GroBen der Formularfelder enthalt sowie deren geometrischen und logischen Zusammenhang. Dariiberhinaus werden die Verbindungen zwischen Teilen des Formulars, z.B. region437, und den entsprechenden Konzepten in der Wissensbasis, z.B. wohnort, reprasentiert. Wahrend die Systeme XTRA und CUBRICON auf unterschiedliche Kontextmodelle fiir den sprachlichen und den piktoriellen Kontext zuriickgreifen, verwendet das System EDWARD [Claassen 92] ein einheitliches Modell, das verschiedene Typen von Kontextfaktoren, wie z.B. Stellung im Satz oder Sichtbarkeit auf dem Bildschirm, beriicksichtigt. WIP unterscheidet sich von den oben genannten Systemen dadurch, daB die Semantik von Bildinhalten nicht nur auf Objektebene (z.B. daB die Bildkonstituente pic-ob-l das Weltobjekt w-obj-l darstellt), sondern auch auf Merkmalsebene (z.B. daB die Eigenschaft 'ist-rot' eines Bildobjekts die Eigenschaft 'ist-defekt' eines Bauteils darstellt) beschrieben wird (vgl. [Rist & Andre 92b; Rist & Andre 92al). Urn die semantische Bezieh:mg zwischen Bildteilen/Bildrelationen und Objekten/Relationen zu beschreiben, wird in Anlehnung an [Mackinlay 86] ein zweistelliges Pradikat der Form (Enkodiert <graphisches Mittel> <information» verwendet. Eine Menge soIcher Enkodierrelationen bildet dann eine semantische Beschreibung eines Bildes, auf deren Grundlage Inferenzprozesse durchgefiihrt werden konnen. Da sich Bildattribute wahrend des Generierungsprozesses andern konnen, ist zu gewahrleisten, daB der piktorielle Kontext standig aktualisiert wird. Wahlt der Graphikgenerator beispielsweise aufgrund zusatzlicher Auftrage eine andere Perspektive, so ist zu priifen, ob bereits berechnete raumliche Relationen noch aktuell sind. 14 5.3 Raumliche uod zeitliche Koordioatioo der Ausgabe Eine weitere Koordinationsaufgabe ist die Integration der einzelnen Generatorergebnisse in einer multimedialen Ausgabe. Hierunter £allt die riiumliche Anordnung von Textblocken und Bildern durch eine Layoutkomponente. Einer solchen Komponente kommt nicht nur die Aufgabe zu, Text- und Bildteile in einer moglichst ansprechenden Form auf die zur Verfugung stehenden Dokumentseiten oder Bildschirmfenster zu verteilen (kiinstlerisches Layout), sondern auch inhaltliche Zusammenhiinge zu vermitteln (Junktionales Layout). Beispielsweise kann die rhetorische Struktur eines Dokuments mitunter sehr effektiv durch das Layout ubertragen werden . Daher mussen neb en linguistischen Constraints (Wortwahl, Festlegung syntaktischer Strukturen usw.) zur sprachlichen Wiedergabe von rhetorischen Relationen (vgl. [Scott & Sieckenius de Souza 90]) auch graphische Constraints (Plazierung, Abstand usw .) definiert werden (vgl. [Hovy & Arens 91; Graf 92]), die die rhetorische Struktur des Dokuments reflektieren. Fur eine Reihe von rhetorischen Relationen sind bereits Designheuristiken bekannt. Beispielsweise werden Bilder, die durch 'Sequence' oder 'Contrast' zueinander in Beziehung stehen, vorzugsweise nebeneinander angeordnet. FaBt eine Graphik den Text zusammen, so sollte sie unter dem Text stehen, di ent sie hingegen zur Einfuhrung in ein Gebiet, so ist sie nach Moglichkeit uber dem Text zu plazieren. Wird dem Benutzer Information mit Hilfe dynamischer Medien vermittelt (z.B. gesprochene Sprache, Zeigegesten und animierte Darstellungen), so sind die Ausgabe der Generatorergebnisse nicht nur raumlich, sondern auch zeitlich zu koordinieren. Beispielsweise ist festzulegen, zu welch em Zeitpunkt eine bestimmte Zeigegeste beginnen soIl und wievicl Zeit sie in Anspruch nehmen darf. Bisher beschiiftigen sich erst wenige Arbeiten mit der Koordination dynamischer Medien. Erste Ideen zur zeitlichen Koordination gesprochener Sprache und animierter Darstellungen werden in [Andre et al. 87], [Feiner et al. 93] und [Andre et al. 93b] beschrieben. 6 Aufbau von IMP-Systemen 13eim Entwurf eines IMP-Systems ist eine adiiquate Behandlung der Abhiingigkeiten zwischen den durchzufuhrenden Entscheidungsprozessen zu gewiihrleisten. A us der Textgenerierung ist bekannt, daB es iiuBerst schwierig ist , Inhalte zu planen, ohne uber sprachliches vVissen zu verfugen. Ein streng sequentielles Modell, in dem Information ausschliefilich von der inhaltsfestlegenden Komponente zur inhaltsrealisierenden I\omponente flieBt, hat sich als unangemessen erwiesen, da die inhaltsfestlegende Komponent.e alle Entscheidungen der inhaltsrealisierenden Komponente antizipieren muBte (siehe auch [Reithinger 92a]). Dieses Problem verscharft sich, wenn wie in allen oben genannten Systemen fur die Inhaltsrealisierung getrennte Komponenten verantwortlich sind (z.B. ein Text-, ein Graphik- und ein Gestengenerator)' deren Entscheidungsprozesse die inhalt.sfestlegende Komponente nicht antizipieren kann. 15 Ahnliche Probleme treten bei der Inhaltsplanung, der Inhaltsstrukturierung und der Mediumselektion auf. Einerseits hangt die Wahl eines geeigneten Prasentationsmedium weitgehend von der Art und der Struktur der zu prasentierenden Information ab (siehe auch [Andre & Rist 90a; Arens et al. 93b; Roth & Mattis 90]). Andererseits werden 1nhaltsauswahl und Inhaltsstrukturierung durch frlihere Entscheidungen bei der Wahl der Prasentationsmedien beeinflufit. Beispielsweise wird visuelle Information benogtigt, urn mit graphischen Mitteln auf ein Objekt zu verweisenj wird hingegen auf dasselbe Objekt textuell Bezug genommen, ist diese Information moglicherweise irrelevant. Neben Abhangigkeiten zwischen Inhaltsfestlegung, Inhaltsrealisierung und Mediumselektion sind Abhangigkeiten zwischen medienspezifischen Generatoren zu beriicksichtigen. Informationsflufi soUte daher nicht nur zwischen der inhaltsfestlegenden und den inhaltsrealisierenden Komponenten, sondern auch zwischen einzelnen Generatoren moglich sein. Wahrend liber die Art der Entscheidungsprozesse eines IMP-Systems weitgehend Einigkeit herrscht, stehen unterschiedliche Verarbeitungsmodelle zur Diskussion. In COMET wird beim Entwurf einer Prasentation zunachst eine baumartige Struktur aufgebaut, die den Aufbau der zu generierenden Prasentation widerspiegelt. Dieser Strukturbaum wird von den medienspezifischen Generatoren monoton erweitert - Revisionen aufgrund der Mediumselektion sind nicht vorgesehen . Den Abhangigkeiten zwischen Textund Graphikgenerierung wurde mehr Aufmerksamkeit gewidmet. Beispiele hierflir sind die Abstimmung von Bild- und Satzgrenzen sowie die Generierung von Querverweisen. Urn die Kommunikation zwischen Text- und Graphikgenerierung zu erleichtern, wird die mitzuteilende Information in einer einheitlichen Reprasentationssprache an die beiden Generatoren libergeben. Da beide Generatoren von derselben Reprasentationssprache ausgehen, konnen sie sich gegenseitig Information liber ihre Entscheidungen und Ergebnisse mitteilen, indem sie die 1nhaltsspezifikation mit Annotationen versehen. Jeder Generator hat damit Zugriff auf die Ergebnisse anderer Generatoren und kann seine eigenen Ergebnisse entsprechend darauf abstimmen. Arens und Kollegen [Arens et al. 93a] beschaftigen sich mit Abhangigkeiten zwischen Inhaltsstrukturierung und Mediumselektion. Sie vertreten die Auffassung, daB die Bestimmung eines geeigneten Mediums erst dann moglich ist, wenn die Diskursstruktur vollstandig vorliegt. Daher schlagen sie eine strikte Trennung von Planungsund Mediumauswahlprozessen vor. Wahrend des Planungsprozesses wird zunachst die Diskursstruktur des zu generierenden Dokuments vollstandig aufgebaut. Diese ist im wesentlichen durch die kommunikativen Ziele des Prasentators und den mitzuteilenden Inhalt bestimmt. AnschlieBend erfolgt anhand spezieller Regeln [Arens et al. 93b] die Mediumauswahl. Nach der Mediumauswahl wird die Diskursstruktur von unten nach oben durchlaufen, wobei anhand von Transformationsregeln die Diskursstruktur in eine prasentationsnahe Struktur (Priisentationstruktur) liberflihrt wird. Problematisch an c1iesem Ansatz ist, daB diese Prasentationsstruktur offensichtlich keinerlei Einfluf3 auf die Diskursstruktur hat. Zwar wird die Auswahl des Mediums von der Diskursstruktur bein- 16 fiufit, Inhalte werden allerdings unabhiingig vom Medium ausgewiihlt. Urn Abhiingigkeiten zwischen Inhaltsselektion, Inhaltsstrukturierung und Mediumselektion zu beriicksichtigen, ist es jedoch notwendig, die einzelnen Prozesse enger als in den oben beschriebenen Systemen miteinander zu verzahnen. Wie bereits erliiutert wird in WIP fiir aIle drei Prozesse ein einheitlicher Planungsmechanismus verwendet. Er ermoglicht es, die Mediumselektion schon wahrend der Inhaltsfestlegung durchzufiihren und nicht erst danach wie beispielsweise in den obigen Systemen. Inhaltsrealisierung und Inhaltsfestlegung werden hingegen von separaten Komponenten, die auf unterschiedliche Wissensbasen zugreifen, iibernommen. Die Modularisierung ermoglicht einerseits Parallelverarbeitung, macht jedoch andererseits Interaktion zwischen den Komponenten notwendig. Ahnlich wie in COMET erfolgt die Kommunikation zwischen den einzelnen Komponenten iiber den Designplan, auf den aIle Komponenten Lese- und Schreibzugriff haben. 7 Schlu6bemerkung Die Verfiigbarkeit neuer Medien eroffnet neue Wege der Informationsprasentation und wirft neue interessante Fragestellungen auf, wie beispielsweise die Verteilung der Information auf verschiedene Medien sowie die Koordination von Medien untereinander. Andererseits treten Probleme auf, die bereits von der Textgenerierung her bekannt sind. Eine zentrale Feststellung <lieses Papiers ist, daB sich multimediale Prasentationen nach ahnlichen Prinzipien strukturieren lassen wie reine Texte. Konzepte, wie Sprechakte und rhetorische Relationen, die sich bereits fiir die automatische Generierung von Text als erfolgreich erwiesen haben, sind auch fiir die Generierung von multimedialen Prasentationen brauchbar. Aus diesem Grund konnen Methoden zur Planung des Inhalts und del' Struktur von Texten im Hinblick auf die Generierung von multimedialen Prasentationen verallgemeinert werden. Tatsiichlich hat del' Forschungsbereich Textgenerierung einen wesentlichen Anteil an del' Entwicklung del' ersten Generation von IMP-Systemen. Inwiefern eine eingehendcre Deschiiftigung mit den zahlreichen noch unzureichend gelosten Aufgabenstellungen anregende Impulse fiir die Textgenerierung bringen wird, bleibt abzuwarten . Literatur [Allgayer et al. 89J J. Allgayer, K. Harbusch , A. Kobsa , C. Reddig , N. Reithinger, und D. Schmauks. XTRA: A Natural-Language Access System to Expert Systems. International Journal of Man-Machine Studies, 31:161-195, 1989. [Andre & Rist 90a] E. Andre und T. Rist. Synthesizing Illustrated Documents: A PlanBased Approach. In: Proceedings of InfoJapan '90, Vol. 2, S. 163-170, Tokyo, 1990. Auch als DFKI Research Report RR-91-06 . 17 [Andre & Rist 90b] E. Andre und T. Rist. Towards a Plan-Based Synthesis oj Illustrated Documents. In: Proc. of the 9 th ECAI, S. 25- 30, Stockholm, July 1990. Auch als DFKI Research Report RR-9 0-11. [Andre & Rist 93] E. Andre und T. Rist. The D esign of Illustrat ed Docu ments as a Planning Task. In: M. Maybury (Hrsg.), Intelligent Multimedia Interfaces, S. 94-116. AAAI Press, 1993. Auch als DFKI Research Report RR-92-45. [Andre et al. 87] E. Andre, T. Rist , und G. Herzog. Generierung natiirlichsprachlicher AufJerungen zur simultanen B eschreibung von zeitveriinderlichen Szenen. In: K. Morik (Hrsg.), GWAI-87: 11th German Workshop on Artificial Intelligence, S. 330-338. Berlin, Heidelberg: Springer, 1987. [Andre et al. 93a] E. Andre, W. Finkler, W. Graf, T. Rist , A. Schauder, und W. Wahlster. WIP: The Automatic Synthesis of Multimodal Presentations. In: M. Maybury (Hrsg.), Intelligent Multimedia Interfaces, S. 75- 93 . AAAI Press, 1993. Auch als DFKI Research Report RR-92-46. [Andre et al. 93b] E. Andre , W. Graf, J. Heinsohn, B. Nebel , H.-J. Profitlich , T. Rist , und W. Wahlster. PPP - Personalized Plan-Based Presenter. Document D-93-5, DFKI, Saarbriicken, 1993. [Arens et al. 91] Y. Arens , L. Miller, und N. Sondheimer. Presentation Design Using an Integrated Knowledge Base. In: J. W. Sullivan und S. W. Tyler (Hrsg .), Intelligent User Interfaces, S. 241 - 258. New York, NY: acm press, 1991. [Arens et al. 93a] Y. Arens, E. Hovy , und S. van Mulken. Structure and Rules in Automated Multimedia Presentation Planning. In: Proc. of the 13 th IJCAI, Chambery, France, 1993. [Arens et al. 93b] Y. Arens, E. Hovy, und M. Vossers. Describing the Presentational Knowledge Underlying Multimedia Instruction Manuals. In: M. Maybury (Hrsg.), Intelligent Multimedia Interfaces . AAAI Press, 1993. [Bandyopadhyay 90] S. Bandyopadhyay. Towards an Underslanding oj Coh erence in Multimodal Discourse. Technical Memo TM-90-01, Deutsches Forschungszentrum fiir Kiinstliche Intelligenz (DFKI), Saarbriicken, Germany, 1990. [Bertin 67] J. Bertin. Semiologie graphique. Paris: Mouton & Cie, 1967. [Bieger & Glock 86] G.R. Bieger und M.D. Glock. Comprehending Spatial and Contextual Information in Picture- Text Instructions. The Journal of Experimental Education, 45(4) :1 81- 188,1986. [Casner 91] S.M. Casner. A Task-Analytic Approach to the Automated Design oj Graphic Presentations. ACM Transactions on Graphics, 10(2):111 - 151, April 1991. 18 [Claassen 92] W. Claassen. Genemting Referring Expressions in a Multimodal Environment. In: R. Dale, E. Hovy, D. Rosner, und O. Stock (Hrsg.), Aspects of Automated Natural Language Generation: Proc. of the 6th International Workshop on Natural Language Generation, S. 247- 262. Berlin , Heidelberg: Springer, 1992. [Costabile et al. 92] M. F . Costabile, T. Catarci, und S. Levialdi (Hrsg.). Advanced Visual Interfaces (Proceedings of AVI '92, Rome, Italy). Singapore: World Scientific Press, 1992. [Dilley et al. 92] S. Dilley, J. Bateman, U. Thiel, und A. Tissen. Integrating Natural Language Components into Graphical Discourse. In: Proc. of the Third Conference on Applied Natural Language Processing, S. 72-79, Trento, Italy, 1992. [Feiner & McKeown 91] S.K. Feiner und K.R. McKeown. Automating the Generation of Coordinated Multimedia Explanations. IEEE Computer, 24(10):33- 41, 1991. [Feiner et al. 93] S. K. Feiner, D. J. Litman, K. R. McKeown, und R. J. Passonneau. Towards Coordinated Temporal Multimedia Presentations. In: M. Maybury (Hrsg.), Intelligent Multimedia Interfaces. AAAI Press, 1993. [Graf 92] W. Graf. Constraint-Based Graphical Layout of Multimodal Presentations. In: Costabile et al. [Costabile et al. 92]. Auch als DFKI Research Report RR-92-15. [Grimes 75] J.E. Grimes. The Thread of Discourse. The Hague, Paris: Mouton, 1975. [Herzog et al. 93] G. Herzog, W. Maass, und P. Wazinski. VITRA GUIDE: Utilisation du langage naturel et de representations gmphiques pour la desc1'iption d'itineraires. In: Images et Langages: Multimodalite et Modelisation Cognitive, Paris, April 1993. [Hobbs 78] J. Hobbs. Why is a discourse coherent? Technical Report 176, SRI International, Menlo Park, CA, 1978. [IIovy & Arens 91] E. H. Hovy und Y. Arens. Automatic Generation of Formatted Text. In: Proc. of AAAI-91, S. 92- 97, Anaheim, CA, 1991. [Hunter et al. 87] B. Hunter, A. Crismore, und P.D. Pearson. Visual Displays in Basal Readers and Social Studies Textbooks. In: D.M. Willows und H. A. Houghton (Hrsg.), The Psychology of Illustration, Basic Research, Band 2, S. 116- 135. New York, Berlin, Heidelberg: Springer, 1987. [Kerpedjiev 92] S. M. Kerpedj iev. Automatic Generation of Multimodal Weather Repods from Datasets. In: Proc. of the Third Conference on Applied Natural Language Processing, S. 48- 55, Trento, Italy, 1992. [Kjorup 78] S. Kjorup. Pictorial Speech Acts. Erkenntnis, 12:55- 71, 1978. 19 [Levin et al. 87] J.R. Levin, G.J. Anglin, und R. N. Carney. On Empirically Validating Functions of Pictures in Prose. In: D.M. Willows und H. A. Houghton (Hrsg.), The Psychology of Illustration, Basic Research, Band 1, S. 51-85. New York, Berlin, Heidelberg: Springer, 1987. [Mackinlay 86] J. Mackinlay. Automating the Design of Graphical Presentations of Relational Information. ACM Transactions on Graphics, 5(2):110- 141, April 1986. [Mann & Thompson 87] W. C. Mann und S. A. Thompson. Rhetorical Structure Theory: Description and Construction of Text Structures. In: G. Kempen (Hrsg.), Natural Language Generation: New Results in Artificial Intelligence, Psychology, and Linguistics, S. 85-95. Dordrecht: Martinus Nijhoff Publishers, 1987. [Marks 91] J. Marks. Discourse Coherence and the Consistent Design of Informational Graphics. In: Workshop Notes from the Ninth National Conference on Artificial Intelligence, S. 29-36, Anaheim, CA, 1991. [Maybury 89] M. T. Maybury. Enhancing Explanation Coherence with Rhetorical Strategies. In: Proc. of the 4 th EACL, S. 168-173, Manchester, UK, 1989. [Maybury 91] M. T. Maybury. Planning Multimedia Explanations Using Communicative Acts. In: Proc. of AAAI-91, S. 61-66, Anaheim, CA, 1991. [McKeown et al. 90] K. McKeown, M. Elhadad, Y. Fukumoto , J. Lim, C. Lombardi, J. Robin, und F. Smadja. Natural Language Generation in COMET. In: R. Dale, C. Mellish, und M. Zock (Hrsg.), Current Research in Natural Language Generation, S. 103-139. London: Academic Press, 1990. [McKeown et al. 92] K. R. McKeown, S. K. Feiner, J. Robin, D. D. Seligmann , und M. Tanenblatt. Generating Cross-References for Multimedia Explanation. In: Proc. of AAAI-92, S. 9- 16, San Jose, CA, 1992. [McKeown 85] K. R. McKeown. Text Generation. Cambridge, MA: Cambridge University Press, 1985. [Moore & Paris 89] J. D. Moore und C. L. Paris. Planning Text for Advisory Dialogu es. In: Proc. of the 27 th ACL, S. 203- 211, 1989. [Moore & Swartout 90] J. D. Moore und W. R. Swartout. Pointing: A Way Toward Explanation Dialogue. In: Proc. of AAAI-90, S. 457- 464, Boston, MA, 1990. [Neal & Shapiro 91] J. G. Neal und S. C. Shapiro. Intelligent Multi-Media Int erface Technology. In: J. W. Sullivan und S. W. Tyler (Hrsg.), Intelligent User Interfaces, S. 11-43. New York, NY: acm press, 1991. [Paris 91] C. 1. Paris. Generation and Explanation: Building an Explanation Facility for the Explainable Expert Systems Framework. In: C. 1. Paris, W. R. Swartout, und W. C. Mann (Hrsg.), Natural Language Generation in Artificial Intelligence and Computational Linguistics, S. 49- 82. Boston: Kluwer, 1991. 20 [Reiter et al. 92] E. Reiter, C. Mellish, und J. Levine. Automatic Genemtion of OnLine Documentation in the IDAS Project. In: Proc. of the Third Conference on Applied Natural Language Processing, S. 64-71, Trento, Italy, 1992. [Reithinger 92a] N. Reithinger. Eine pamllele Architektur zur inkrementellen Generierung multimodaler Dialogbeitriige. infix, 1992. [Reithinger 92b] N. Reithinger. The Performance of an Incremental Genemtion Component for Multi-Modal Dialog Contributions. In: R. Dale, E. Hovy, D. Rosner, und O. Stock (Hrsg.), Aspects of Automated Natural Language Generation: Proc. of the 6th International Workshop on Natural Language Generation, S. 263-276. Berlin, Heidelberg: Springer, 1992. [Rist & Andre 92a] T. Rist und E. Andre. From Presentation Tasks to Pictures: Towards a Computational Approach to Gmphics Design. In: Proc. of the 10 th ECAI, S. 764- 768, Wien, 1992. Auch als DFKI Research Report RR-92-44. [Rist & Andre 92b] T. Rist und E. Andre. Inco1'pomting Graphics Design and Realization into the Multimodal Presentation System WIP. In: Costabile et al. [Costabile et al. 92]. [Roth & Mattis 90] S. F. Roth und J. Mattis. Data Chamcterization for Intelligent Gmphics Presentation. In: Proc. of CHI-90, S. 193- 200, 1990. [Roth et al. 91] S. F. Roth, J. Mattis, und X. Mesnard. Gmphics and Natuml Language as Components of Automatic Explanation. In: J. W. Sullivan und S. W. Tyler (Hrsg.), Intelligent User Interfaces, S. 207- 239. New York, NY: acm press, 1991. [Scott & Sieckenius de Souza 90] D. R. Scott und C. Sieckenius de Souza. Getting the Message Across in RST-Based Text Genemtion. In: R. Dale, C. Mellish, und M. Zock (Hrsg.), Current Research in Natural Language Generation, S. 47- 73. London: Academic Press, 1990. [Searle 80] J.R. Searle. Speech Acts: An Essay in the Philosophy of Language. Cambridge, MA: Cambridge University Press, 1980. [Stock 91] O. Stock. Natuml Language and Explomtion of an Information Space: The ALFresco Intemctive System. In: Pl'oc. of the 12 th IJCAI, S. 972- 978, Sidney, Australia, 1991. [Vossel's 91] M. Vossers. To W1'ite or to Draw? Automatic Genemtion of Formatted Text and Line Drawings. Diplomarbeit, University of Nijmegen, Nijmegen, Niederlande, 1991. [Wahlster et al. 91] W. Wahlster, E. Andre, W. Graf, und T. Rist. Designing Illustmted Texts: How Language Production is Influenced by Gmphics Genemtion. In: Proc. of the 5 th EACL, S. 8- 14, Berlin, Germany, 1991. 21 [Wahlster et al. 92] W. Wahlster, E. Andre, S. Bandyopadhyay, W. Graf, und T. Rist. WIP: The Coordinated Generation of Multimodal Presentations from a Common Representation. In: A. Ortony, J. Slack, und O. Stock (Hrsg.), Communication from an Artificial Intelligence Perspective: Theoretical and Applied Issues, S. 121-144. Berlin, Heidelberg: Springer, 1992. Auch als DFKI Research Report RR-91-0S. [Wahlster et al. 93] W. Wahlster, E. · Andre, W. Finkler, H.-J. Profitlich, und T. Rist. Plan-Based Integration of Natural Language and Graphics Generation. AI Journal, 63:387-427, 1993. Auch als DFKI Research Report RR-93-02. [Wazinski 91] P. Wazinski. Objektlokalisation in graphischen Darstellungen. Diplomarbeit, Universitat des Saarlandes, Saarbriicken, 1991. [Wazinski 92] P. Wazinski. Generating Spatial Descriptions for Cross-Modal References. In: Proc. of the Third Conference on Applied Natural Language Processing, S. 5663, Trento, Italy, 1992. [Wilson et al. 92] M. Wilson, D. Sedlock, J.-L. Binot, und P. Falzon. An Architecture For Multimodal Dialogue. In: Proc. of the Second Vencona Workshop for Multimodal Dialogue, Vencona, Italy, 1992. 22 DFKI -BibliothekPF 2080 67608 Kaiserslautern Deutsches Forschungszentrum fOr KOnstliche Intelligenz GmbH FRO DFKI Publikationen DFKI Publications Die folgenden DFKI Veroffentlichungen sowie die aktuelle Liste von allen bisher erschienenen Publikationen konnen von der oben angegebenen Adresse oder per anonymem ftp von ftp.dfki.unikl.de (131.246.241.1 00) unter pub/Publications bezogen werden. Die Berichte werden, wenn nicht anders gekennzeichnet, kostenlos abgegeben. The following DFKI publications or the list of all published papers so far are obtainable from the above address or per anonymous ftp from ftp .dfki.uni-kl.de (131.246.241.100) under pub/Publications. The reports are distributed free of charge except if otherwise indicated. DFKI Research Reports RR-92-S4 Harold Boley: A Direkt Semantic Characterization of RELFUN RR-93-03 Franz Baader. Berhard Hol/under . Bernhard Nebel. Hans-Jurgen Profitlich. Enrico Franconi: An Empirical Analysis of Optimization Techniques for Terminological Representation Systems 30 pages 28 pages RR-92-SS John Nerbonne, Joachim Laubsch. Abdel Kader Diagne. Stephan Oepen : Natural Language Semantics and Compiler Technology 17 pages RR-93-04 Christoph Klauck . Johannes Schwagereit: GGD: Graph Grammar Developer for features in CAD/CAM 13 pages RR-92-S6 Armin Laux: Integrating a Modal Logic of Knowledge into Terminological Logics RR-93-05 Franz Baader. Klaus Schulz : Combination Techniques and Decision Problems for Disunification 34 pages 29 pages RR-92-58 Franz Baader. Bernhard Hol/under: How to Prefer More Specific Defaults in Terminological Default Logic RR-93-06 Hans-Jurgen Burckert. Bernhard Hol/under. Armin Laux: On Skolemization in Constrained Logics 31 pages RR-92-59 Karl Schlechta and David Makinson : On Principles and Problems of Defeasible Inheritance 13 pages RR-92-60 Karl Schlechta: Defaults, Preorder Semantics and Circumscription 19 pages RR-93-01 Bernhard Hol/under: An Alternative Proof Method for Possibilistic Logic and its Application to Terminological Logics 25 pages RR-93-02 Wolfgang Wahlster. Elisabeth Andre. Wolfgang Finkler. Hans-Jurgen Profitlich. Thomas Rist: Plan-based Integration of Natural Language and Graphics Generation 50 pages 40 pages RR-93-07 /1ans-lurgen Burckert. Bernhard Hol/under. Armin Laux: Concept Logics with Function Symbols 36 pages RR-93-08 Harold Boley. Philipp Hanschke. Knut Hinkelmann. Manfred Meyer: COLAB: A Hybrid Knowledge Representation and Compilation Laboratory 64 pages RR-93-09 Philipp Hanschke. lorg Wurtz : Satisfiability of the Smallest Binary Program 8 Seiten RR-93-10 Martin Buchheit. Francesco M . Donini. Andrea Schaerf: Decidable Reasoning in Terminological Knowledge Representation Systems 35 pages RR·93·11 RR·93-25 Bernhard Nebel. Hans-Juergen Buerckert: Reasoning about Temporal Relations: A Maximal Tractable Subclass of Allen's Interval Algebra Klaus Fischer, Norbert Kuhn: A DAI Approach to Modeling the Transportation Domain 28 pages RR·93·12 Pierre Sablayrolles: A Two-Level Semantics for French Expressions of Motion 51 pages RR·93·13 Franz Baader. Karl Schlechta: A Semantics for Open Normal Defaults via a Modified Preferential Approach 93 pages RR·93·26 Jorg P. Muller. Markus Pischel: The Agent Architecture InteRRaP: Concept and Application 99 pages RR·93·27 Hans-Ulrich Krieger: Derivation Without Lexical Rules 33 pages RR·93·28 25 pages Hans-Ulrich Krieger. John Nerbonne, Hannes Pirker: Feature-Based Allomorphy RR·93·14 8 pages Joachim Niehren. Andreas Podelski,RalfTreinen: Equational and Membership Constraints for Infinite Trees 33 pages RR·93·15 Frank Berger . Thomas Fehrle. Kristof KlOckner, Volker Schemes. Markus A. Thies. Wolfgang Wahlster: PLUS - Plan-based User Support Final Project Report RR·93·29 Armin Laux: Representing Belief in Multi-Agent Worlds viaTerminological Logics 35 pages RR·93·30 Stephen P . Spa ckman, Elizabeth A. Hinkelman: Corporate Agents 14 pages 33 pages RR·93·31 RR·93·16 Elizabeth A. Hinkelman. Stephen P . Spackman: Abductive Speech Act Recognition, Corporate Agents and the COSMA System Ge:t Smolka. Martin Henz. Jorg Wurtz: ObjectOnented Concurrent Constraint Programming in Oz 17 pages RR·93·17 Rolf Backofen: Regular Path Expressions in Feature Logic 37 pages RR·93·18 Klaus Schild: Terminological Cycles and the Propositional J.l-Calculus 32 pages RR·93·20 Franz Baader. Bernhard Hollunder: Embedding Defaults into Terminological Knowledge Representation Formalisms 34 pages RR·93·22 Manfred Meyer, Jorg Muller: Weak Looking-Ahead and its Application in Computer-Aided Process Planning 17 pages RR·93·23 Andreas Dengel. Oltmar Lutzy: Comparative Study of Connectionist Simulators 20 pages RR·93·24 Rainer Hoch. Andreas Dengel: Document Highlighting Message Classification in Printed Business Letters 17 pages 34 pages RR·93·32 David R. Traum, Elizabeth A. Hinkelman: Conversation Acts in Task-Oriented Spoken Dialogue 28 pages RR·93·33 Bernhard Nebel, Jana Koehler: Plan Reuse versus Plan Generation: A Theoretical and Empirical Analysis 33 pages RR·93·34 Wolfgang Wahlster: Verbmobil Translation of Face-To-Face Dialogs 10 pages RR·93·35 lIarold Boley. Franc;ois Bry, Ulrich Geske (Eds.): Neucre Entwicklungen der deklarativen KIProgrammierung - Proceedings 150 Sciten Note: This document is available only for a nominal charge of25 DM (or 15 US-$). RR·93·36 Michael M. Richter, Bernd Bachmann . Ansgar Bernardi . Christoph Klauck . Ralf Legleitner. Gabriele Schmidt: Von IDA bis IMCOD: Expcrtensystcme im CIM-Umfeld 13 Sciten RR-93-38 Stephan Baumann: Document Recognition of Printed Scores and Transformation into MIDI 24 pages RR-93-40 Francesco M. Domni. Maurizio Lenzerini. Daniele Nardi. Werner Null. Andrea Schaerf: Queries, Rules and Definitions as Epistemic Statements in Concept Languages 23 pages RR-93-41 Winfried H. Graf: LAYLAB: A Constraint-Based Layout Manager for Multimedia Presentations 9 pages RR-93-42 Hubert Comon. RalfTreinen: The First-Order Theory of Lexicographic Path Orderings is Undecidable 9 pages RR-93-43 M. Bauer. G. Paul: Logic-based Plan Recognition for Intelligent Help Systems 15 pages RR-93-44 Martin Buchheit. Manfred A. Jeusfeld. Werner NUll. Martin Staudt: Subsumption between Queries to Object-Oriented Databases 36 pages RR-93-4S DFKI Technical Memos TM-92-01 Lijuan Zhang: Entwurf und Implementierung eines Compilers zur Transformation von Werkstlickreprasentationen 34 Seiten TM-92-02 Achim Schupeta: Organizing Communication and Introspection in a Multi-Agent Blocksworld 32 pages TM-92-03 Mona Singh: A Cognitiv Analysis of Event Structure 21 pages TM-92-04 Jargen Maller. Jorg Maller. Markus Pischel. Ralf Scheidhauer: On the Representation of Temporal Knowledge 61 pages TM-92-0S Franz Schmalhofer. Christoph Globig. Jorg Thoben: The refilling of plans by a human expert 10 pages TM-92-06 Ouo Kahn. Franz Schmalhofer: Hierarchical skeletal plan refinement: Task- and inference structures 14 pages Rainer Hoch: On Virtual Partition ing of Large Dictionaries for Contextual Post-Processing to Improve Character Recognition Anne Kilger: Realization of Tree Adjoining Grammars with Unification 21 pages 27 pages RR-93-46 TM-93-01 Philipp Hanschke: A Declarative Integration of Terminological. Constraint-based. Data-driven, and Goal-directed Reasoning Otto Kahn. Andreas Birk: Reconstructive Integrated Explanation of Lathe Production Plans 81 pages RR-93-48 TM-92-08 20 pages TM-93-02 Franz Baader. Martin Buchheit. Bernhard Hol/under: Cardinality Restrictions on Concepts Pierre Sablayrolles. Achim Schupeta: Conlfict Resolving Negotiation for COoperative Schedule Management 20 pages 21 pages RR-94-01 TM-93-03 Elisabeth Andre. Thomas Ris/: Multimedia Presentations: The Support of Passive and Active Viewing lIarold Boley. Ulrich Buhrmann. Christof Kremer: Konzeption einer deklarativen Wissensbasis Uber recyc1ingrelevante Materialien 15 pages 11 pages RR-94-02 TM-93-04 Elisabeth Andre. Thomas Rist: Von Textgeneratoren zu IntellimediaPrtisentationssystemen Hans-GUnther Hein: Propagation Techniques in W AM-based Architectures - The FIDO-III Approach 22 pages 105 pages RR-94-0S TM-93-0S Franz Schmalhofer. J.Stuart Aitken. Lyle E. Bourne jr.: Beyond the Knowledge Level: Descriptions of Rational Behavior for Sharing and Reuse Michael Sintek: Indexing PROLOG Procedures into DAGs by Heuristic Classification 81 pages 64 pages OFKI Oocuments 0-92-28 Klaus-Peter Gores. Rainer Bieisinger: Ein Modell zur Reprasentation von Nachrichtentypen 56 Seiten 0-93-01 Philipp Hanschke. Thom Fruhwirth: Terminological Reasoning with Constraint Handling Rules 12 pages 0-93-02 Gabriele Schmidt. Frank Peters. Gernod Laufkotter: User Manual of COKAM+ 23 pages 0-93-03 Stephan Busemann. Karin Harbusch(Eds.): DFKI Workshop on Natural Language Systems: Reusability and Modularity - Proceedings 74 pages 0-93-04 DFKI Wissenschaftlich-Technischer Jahresbericht 1992 194 Seiten 0-93-11 Knutllinkelmann. Armin Laux (Eds.): DFKI Workshop on Knowledge Representation Techniques - Proceedings 88 pages 0-93-12 Harold Boley. Klaus Elsbernd. Michael Herfert. Michael Sintek. Werner Stein : RELFUN Guide: Programming with Relations and Functions Made Easy 86 pages 0-93-14 Manfred Meyer (Ed.) : Constraint Processing Proceedings of the International Workshop at CSAM'93, July 20-21,1993 264 pages Note: This document is available only for a nominal charge of 25 DM (or 15 US-$). 0-93-15 Robert Laux: Untersuchung maschineller Lernverfahren und heuristischer Methoden im Hinblick auf deren Kombination zur Unterstiitzung eines Chart-Parsers 86 Seitcn 0-93-05 Elisabeth Andre. Winfried Graf. lochen Heinsohn. Bernhard Nebel. Hans-lurgen Profitlich. Thomas Rist. Wolfgang Wahlster: PPP: Personalized Plan-Based Presenter 0-93-16 Bernd Bachmann . Ansgar Bernardi. Christoph Klauck. Gabriele Schmidt: Design & KI 70 pages 0-93-20 Bernhard Herbig: Eine homogene Implementierungsebene filr einen hybriden Wissensreprasentationsformalismus 0-93-06 lurgen Muller (Hrsg.): Beitrage zum Griindungsworkshop der Fachgruppe Verteilte Kiinstliche Intelligenz, Saarbriicken, 29. 30. April 1993 235 Seiten Note: This document is available only for a nominal charge of 25 DM (or 15 US-$). 0-93-07 Klaus-Peter Gores. Rainer Bieisinger: Ein erwartungsgesteuerter Koordinator zur partiellen Textanalyse 53 Seiten 74 Seitcn 97 Scitcn 0-93-21 Dennis Drollinger: Intelligentes Backtracking in Inferenzsystemen am Beispiel Terminologischer Logiken 53 Seiten D-93-22 Andreas Abecker: Implementierung graphischer Benutzungsobcrflachen mit TcJ(Tk und Common Lisp 44 Seitcn 0-93-08 Thomas Kieninger. Rainer Hoch: Ein Generator mit Anfragesystem fUr strukturierte Worterbiicher zur Unterstiitzung von Texterkennung und Textanalyse 0-93-24 Brigille Krenn. Martin Volk : DiTo-Datenbank: Datendokumentation zu Funktionsverbgefiigen und Relativsatzen 125 Seiten 66 Scitcn 0-93-09 Hans-Ulrich Krieger. Ulrich Schafer: TDL ExtraLight User's Guide 0-93-25 lIans-lurgen Burckert . Werner Null (Eds.): Modeling Epistemic Propositions 35 pages 0-93-10 Elizabeth Hinkelman. Markus Vonerden.ChrislOph lung : Natural Language Software Registry (Second Edition) 174 pages 118 pages Note: This document is available only for a nominal charge of 25 DM (or 15 US-S) . 0-93-26 Frank Peters: Unterstiitzung des Experten bei der Formalisierung von Textwissen INFOCOM - Eine intcraktive Forrnalisierungskomponente 58 Seiten Von Textgeneratoren zu Intellimedia-Prasentationssystemen Elisabeth Andre, Thomas Rist RR-94-02 Research Report