Skip to content
Sections
http://www.fernfachhochschule.ch/ffhs/afe/lws/forschung/acthttp://www.fernfachhochschule.ch/ffhs/studieren/stundenplaene/stundenplan-1/stundenplan-evt

Forschungsblog

Was gibt es neues im Bereich Web Science? Was sind die aktuellen Themen in der Forscher-Community? Hier kann man sich informieren.
Die Abkürzung LWS steht immer für Laboratory for Web Science.

 

12.05.11


KTI Projekt-Eingabe mit ETH positiv!

Wir haben von der KTI ein GO für unser Projekt mit der ETH bekommen.
Es ist das erste KTI Projekt seit der Gründung des LWS vor zwei
Jahren.
Innerhalb des Projektes entwickeln wir einen Recommender für eine
spezielle Job-Hunting Plattform. Die Herausforderung dabei ist, dass
der Recommender abgesehen von qualitativ hochwertigen Vorschlägen
auch eine 'Profit-Maximierung' der Platform-Benutzer berücksichtigen muss. Diese Komponente eines Recommenders ist neu und wurde so noch nie implementiert.

Wir freuen uns auf die Herausforderungen!
Kontakt für Anregungen und Fragen:Dr. Marcel Blattner 

 

09.03.11


Yahoo! KDD Cup

Yahoo hat eine Competition im Bereich Recommender Systems lanciert. Wir haben mit der TU Graz ein Team gebildet und nehmen an der Competition teil. Die gestellten Aufgaben sind nicht ohne!

Yahoo! KDD Cup

 

07.03.11


Gemischtes

Inzwischen hat sich einiges getan im LWS. Wir haben ein KTI Antrag eingereicht und sind nun in der zweiten Runde. Zusätzlich werden wir diesen Monat zusammen mit der ETH Zürich einen zweiten Antrag einreichen.

Mit BASF hat sich eine Zusammenarbeit ergeben. Wir haben ein System implementiert, welches Voraussagen von Experimenten unter bestimmten Rahmenbedingungen erlaubt.

Die Arbeiten zum Projekt DODE mit dem Kantonsspital St. Gallen wurden aufgenommen. Der entwickelte Prototyp wird im April an einer Konferenz für medizinische Informatik vorgestellt. Wir erhoffen uns dadurch zusätzliche Kontakte und ein Nachfolgeprojekt.

18.6.10 


DODE

So geschafft. Wir haben unseren Projektantrag für das DODE System an die Hasler-Stiftung gesandt. Jetzt hoffen wir, dass wir damit bei der Stiftung die nötigen Drittmittel einholen können.

Ausserdem habe ich heute auf www.google.ch nach Web Science gesucht. Unser LWS erscheint inzwischen auf der ersten Seite auf Position 2!

 9.4.10 


IMCIC Conference Part II

Eigentlich wollte ich jeden Tag von dieser Konferenz berichten. Ich habe aber so viele Eindrücke und Gespräche geführt, dass ich zuerst einmal meine Notizen ordnen und konsolidieren muss. Ich werde das in einer ruhigen Minute am Wochenende machen. Jedenfalls habe ich ein paar ganz spannende und interessante Gespräche geführt. Bald mehr!

6.4.10 


IMCIC Conference Part I

Die IMCIC Konferenz hat heute begonnen. Eigentlich ist es nicht eine Konferenz, sondern gleich drei verschiedene unter einem Dach. Der erste Tag war - wie bei jeder Konferenz - mit mehr Administrativem beladen. Nach dem gestrigen Stress der Anreise war mir dies auch recht. Ab morgen sind die Agenden aber richtig gefüllt. Ich habe mir schon einige Vorträge ganz rot angestrichen. Das Programm ist sehr bunt. Von Meta-Engineering über Web Science zu Roboter-Steuerung ist alles vertreten. Erste Kontakte habe ich auch schon geknüpft. Es gibt wahrhaftig visionäre Projekte. Ein interessantes Gespräch führt ich mit Eldar Sultanow aus Deutschland. Er arbeitet in einer Gruppe, welche globale Datenströme (z.B. in einem Konzern) modelliert und darstellt. Dabei werden die Aktionen, welche die Daten generieren auf multiplen Ebenen (macro, meso, micro) dargestellt. Eldar erkärte mir, dass sie dabei die unterschiedlichsten Technologien verknüpfen. Das Ziel ist ein Tool, welches alle Aktivitäten eines Konzerns in Echtzeit zugänglich macht (Ort/Zeit). Er hat mir auch schon einen ersten Einblick in einen Prototypen gewährt. Das ganze sieht schon beeindruckend aus. Ich habe ihm dann von unserer Forschung erzählt und er meinte es gibt schon einige Schnittpunkte. Z.B. kann man Algorithmen, welche man bei der Analyse von komplexen Netzwerken braucht auf Probleme der Synchronisation von Aktivitäten ansetzen. Es gibt noch weitere Ueberlappung unserer Arbeit und wir werden sicher für einen Austausch von Ideen in Kontakt bleiben. 
So, dass wars fürs Erste.
 

16.03.10


Mind uploading - science fiction?

In vielen Science Fiction Geschichten liest man, dass Menschen oder Wesen einer anderen Welt, ihre Gedanken am Ende ihres Lebens in ein 'Kollektiv' überführen können - eine Art Uploading. Dieser Pool and Gedanken und Gefühlen kann bei Bedarf angezapft werden. Klingt ganz schön abgehoben und für viele Leute sicher ein eher befremdlicher Gedanke. Ich behaupte, wir sind schon viel weiter in dieser Hinsicht, als man vielleicht denkt.

Was ist das World Wide Web eigentlich? Eine lose Ansammlung von Web Seiten? Einfach ein Informations-Pool oder ein Daten-Moloch? Mitnichten. Das WWW ist viel mehr als das geworden. Es beeinhaltet durch die sozialen Netzwerke, Blogs etc. die Gedanken und die Gefühle sehr vieler Menschen. Alles ist zu finden: Freude, Trauer, Wut und aller 'Abfall' der auch zum Menschsein gehört. Jeder mit einem Anschluss an das Netz der Netze kann sich diese Flut von Ausprägungen des Menschsein 'herunterladen', anschauen, kommentieren; ja partizipieren. Aber was ist denn der Akt des Hinterlegens all dieser Informationen schlussendlich? Ein erster Schritt Richtung Mind-Uploading?

Kontakt für Anregungen und Fragen:Dr. Marcel Blattner 

 08.03.10


Verstärkung am LWS

Das LWS bekommt Verstärkung. Anfangs April dürfen wir zwei neue Mitarbeiter am LWS begrüssen:
Dr. Beatrice Paoli und Dr. Fabio Mariotti. Beide haben einen starken naturwissenschaftlichen Hintergrund und bringen viel Know How mit in unser Labor. Wir freuen uns!

 08.02.10


Morphologische Klassifizierung von Galaxien

Wie in der Biologie und anderen naturwissenschaftlichen Disziplinen gibt es in der Kosmologie/Astrophysik Klassifizierungs-Schemata für Sterne, Galaxien etc. Man könnte meinen, dass z.B. die Klassifizierung von Galaxien nach morphologischen Kriterien (Spirale, Ellipse etc.) maschinell durch Image Processing bewältigt wird. Weit gefehlt! Ich war erstaunt, als ich die fast schon steinzeitlich anmutenden Methoden sah, welche zur maschinellen Klassifikationen herangezogen werden. Es gibt jetzt zwei Möglichkeiten: a) ausgereiftere Methoden sind vorhanden, wurden aber aus irgendwelchen Gründen nicht publiziert oder b) es ist tatsächlich so, dass man den einen oder anderen Zug verpasst hat und nicht 'best practice' aus dem Gebiet Pattern Recognition anwendet.

Das Projekt GalaxyZoo - wo Laien mittels Anleitung - Galaxien 'von Hand' klassifizieren können, zeigt mir, dass eher b) zutrifft.

Da gibt es wohl einen Bedarf. Wäre interessant zu sehen, wie State-of-the-Art Algorithmen aus dem Bereich Pattern Recognition performen, wenn man sie auf dieses Problem ansetzt.

Kontakt für Anregungen und Fragen:Dr. Marcel Blattner 

 01.02.10


LWS präsentiert an der IMCIC (international multi-conference on complexity, informatics and cybernetics), Orlando Florida, 6.4.10-9.4.10

Das Paper B-Rank: A top N recommendation Algorithm wurde von der IMCIC akzeptiert für eine Publikation und gleichzeitig für einen Talk freigegeben. Wir freuen uns!

Kontakt für Anregungen und Fragen:Dr. Marcel Blattner 

12.01.10


Suchen Sie eine neue Herausforderung? Am LWS finden Sie mehr als eine!

Das LWS sucht Verstärkung. Falls Sie ein Hochschulabschluss in Informatik, Physik, Mathematik oder einem verwandten Fach haben und neue Forschungsherausforderungen suchen, dann sind Sie bei uns genau richtig!

Check it: offene Stellen

Kontakt für Anregungen und Fragen:Dr. Marcel Blattner 

 04.01.10


User besser verstehen - mission impossible?

Seit einigen Wochen arbeite ich zusammen mit Dr. Matus Medo vom Institut für Theoretische Physik in Fribourg an einem Modell. Dieses Modell soll vorausagen machen, wie Benutzer Objekte oder Informationen in einem bestimmten Umfeld bewerten und wie 'informativ' diese gesammelten Bewertungen sind. Ein solches Modell ist dann in der Lage vorauszusagen, wie gut z.B. ein Recommender System mit gegebener Datengrundlage funktionieren kann.

Das Modell vereint zwei Mechanismen:

  • Selbst-Inkonsistenz: Gleiche Benutzer bewerten gleiche Objekte unterschiedlich zu unterschiedlichen Zeiten. Das bedeutet, dass Benutzer nie selber mit sich übereinstimmen - self-correlation- (gemessen in einem bestimmten Zeitraum).
  • Sozialer Druck: Benutzer tendieren ihre Bewertung dem Voting ihrer Peers anzupassen. Dies führt zu einer Synchronisation in einem Bewertungs-Netzwerk.

Der erste Punkt kann als allgemeines Rauschen in den Daten verstanden werden. Der zweite Punkt kann als Gegenkraft zu diesem Rauschen verstanden werden. Das Modell ist soweit, dass erste Vorausagen gemacht werden können. Tja, und jetzt? Jetzt sind wir auf der Suche nach Daten, welche diese Voraussagen bestätigen...und das ist - so scheint es - das schwierigere Problem. Das ist etwa das Gleiche wie bei einer physikalischen Theorie, welche empirisch untermauert werden muss - es braucht Daten, Daten und nochmals Daten. Konkret: Wir suchen Daten mit folgenden Eigenschaften:

  1. Benutzer haben Objekte/Informationen bewertet.
  2. Benutzer wussten während der Bewertung, wie andere Benutzer das gleiche Objekt bewertet haben .
  3. Jeder Datensatz verfügt über einen 'timestamp'.
  4. Das Design des Bewertungs-Systems wurde über einen langen Zeitraum nicht geändert.

Falls irgend jemand über solche Daten verfügt, oder jemanden kennt, der über solche Daten verfügt, wären wir für einen Hinweis sehr sehr dankbar.

Kontakt für Anregungen und Fragen:Dr. Marcel Blattner 

15.12.09


Künstliche Intelligenz: ein reboot

Das Forschungsgebiet "Artificial-Intelligence", kurz AI, wurde vor ca. 50 Jahren ins Leben gerufen. Die Ziele waren sehr ambitioniert - zu ambitioniert. Die Erwartungen wurden bis heute nicht erfüllt. Dies hat verschiedene "technische" Gründe. Es hat aber auch damit zu tun, dass der Schwung der damaligen Aufbruchstimmung zu nicht einlösbaren Versprechen verleitet hat. Nun ist man 50 Jahre älter und etwas weiser.

Einige der Pioniere der AI wollen einen Neustart versuchen. Und diesmal möchten sie es "richtig" machen. Ein neues Projekt - Mind Machine Project oder MMP - wurde vom MIT ins Leben gerufen. Dieses Projekt ist auf 5 Jahre befristet und hat ein initiales Budget von ca. 5 Millionen Dollar. Das Projekt sieht vor, "fundamentale Annahmen" zu überprüfen und gegebenenfalls anzupassen. Man hofft, grundlegende Fehler korrigieren zu können.

Die Forscher werden sich auf drei Gebiete konzentrieren:

1. Wie kann man Gedanken modellieren?
Anmerkung LWS: ein gutes Model muss in der Lage sein, ein Problem auf verschiedene Arten zu lösen (so wie unser Gehirn das tun kann). Bisher hat man versucht die Silberkugel zu finden (das Model für alles). Dieses Konzept will man nun klar überdenken. Der Trend geht eher zu lose gekoppelten Systemen, welche auch widersprüchlich sein können. Man weiss inzwischen, dass auch unser Gehirn eher auf diese Art und Weise funktioniert.

2. Gedächtnis:
Anmerkung LWS: Unser Gehirn arbeitet nicht konsistent, wenn es um Einschätzungen und Wiedergabe von Erfahrungen und Erlebtem geht. Ein erfolgreiches Pendant in der AI muss mit einer unkonsistenter Funktionsweise fertigwerden.

3. "Körper:"
Anmerkung LWS: Im Gehirn geschieht alles, überall und ständig. Diesem Umstand wurde bisher nur mangelhaft Beachtung geschenkt. Das is auch kein Wunder, da wir Modelle als sequentielle Abfolge von Code-Zeilen implementieren. Das steht aber im starken Kontrast zur "physikalischen Welt". Ein neuer Programmier- und Designansatz, RALA (reconfigurable asynchronous logic automata), soll hier Abhilfe schaffen.

Liest man die "Goals" des Projektes kann man nur sagen: warten wir die nächsten 50 Jahre ab!

Kontakt für Anregungen und Fragen:Dr. Marcel Blattner 

26.11.09


Search engines: Ich liebe sie, ich hasse sie!
Suchmaschinen sind unser Fenster ins World Wide Web. Sie sind unsere Such-Sklaven. Sind wir mit ihnen zufrieden? Machen sie einen guten Job? 'Ja' würden wahrscheinlich die meisten sagen. Aber was heisst 'die meisten' in diesem Zusammenhang? Sind es 80%, 90% oder 50.0002%? Diese Frage ist sehr schwer zu beantworten, da man dafür die Benutzerzufriedenheit messen muss, und das ist ein hartes Stück Brot. Deswegen gibt es keine definitiven Antworten auf obige Fragen.

Dennoch. Es gibt einige Studien, welche ins gleiche Horn blasen. Diese Studien sagen aus, dass ca. 30%-60% der Benutzer mit den gängigen Suchmaschinen NICHT zufrieden sind. Bevor ich einige Gründe dafür gebe, führe ich ein paar interessante Zahlen auf:
Zwischen 67% und 78% der Benutzer brauchen zwei oder weniger Abfragen, um die gewünschte Information zu finden. Anmerkung LWS: Das heisst aber nicht, dass sie die bestmögliche Information gefunden haben.
Zwischen 60% und 85% der Benutzer gehen nicht über die erste Resultat-Seite hinaus.
Ca. 66% aller Benutzer sehen sich weniger als 5 Resultate an. Eine weitere Studie besagt, dass die durchschnittliche Dauer einer Suche nach Informationen ca. 3 Minuten dauert. Dauert es länger, wird der Benutzer unzufrieden. Es wird geschätzt, dass ca. 50% der präsentierten Resultate für den jeweiligen Benutzer relevant sind.
Die Autoren schliessen unter anderem, dass die meisten Benutzer nicht nach komplexen Informationen suchen und die ersten paar Resultate der Abfrage als zufriedenstellend empfunden wird.

OK. Die Aussage, welche hier zwischen den Zeilen mitschwingt: ca. 50% der gelieferten Resultate sind nicht relevant - das ist eine ganze Menge -. Ausserdem heisst ein gefundenes und 'gefressenes' Resultat nicht, dass es das bestmögliche ist. Es ist nur das erste, welches den Benutzer zufriedenstellt. Grundsätzlich steigt die Unzufriedenheit mit der komplexität der Abfrage.

Was sind die Gründe für diesen Zustand?

  • Zuerst einmal muss man sich vor Augen führen, dass Suchmaschinen - wie Google - nach dem Prinzip "Wisdom of the Crowds" funktionieren. "Crowds" mein hier aber vorallem: Web Administratoren, Bloggers, Firmen im allgemeinen. Es ist also nicht verwunderlich, dass nicht alle Informations-Bedürfnisse für jeden abgedeckt werden können, da die Top-Resultate eine Art 'Konsensus' darstellen.
  • Zweitens: Sobald man nach Informationen sucht, welche auch ein käufliches Produkt sein können (z.B. Blumen, CD/DVD etc. etc.), sind die Resultate stark in Richtung Online-Selling verzerrt. Um deskriptive Informationen zu bekommen, muss man dann ganz schön tief 'graben'.
  • Drittens: Unsere Sprache ist für viele 'Konzepte' mehrdeutig: Apfel (Computer oder Frucht), Jaguar (Auto, Tier oder Betriebssystem). Es gibt unzählige solche Beispiele.
  • Viertens: Suchmaschinen können nicht zwischen Frau Meyer und Herr Müller unterscheiden. Unterschiedliche Personen - gleiche Suchresultate.

Zur Zeit sind Suchmaschinen nicht in der Lage zu wissen, was man mit bestimmten Begriffen meint. Die Probleme der Suchmaschinen werden in Zukunft zunehmen. Um dies zu vermeiden, müssen Systeme geschaffen werden, welche individuellen Bedürfnissen gerecht werden. Die Forscher-Community hat dies erkannt und arbeitet hart. Gut. Was sind ihre Erfahrungen mit Suchmaschinen?

Kontakt für Anregungen und Fragen:Dr. Marcel Blattner

Referenzen:

[1] B.J. Jansen and A. Spink, An Analysis of Web Documents Retrieved and Viewed, Proceedings of the 4th International Conference on Internet Computing, 2003, pp.65-69
[2] B.J. Jansen, A. Spink, J Baeman, and T. Saracevic, Real life information retrieval: A study of user queries on the  Web, SIGIR Forum, vol32. no 1, 1998, pp.5-17
[3] D. Hawking, N. Craswell, P. Bailey and K. Griffihs, Measuring search engine quality, Information Retrieval, vol. 4, 2001, pp.33-59
[4] C. Silverstein, M. Henzinger, H. Marais and M. Moricz, Analysis of a Very Large AltaVista log, Technical Repport, Digital Systems Research Center, 1998.

16.11.09


Vor kurzem ging die ACM Konferenz Recommender Systems 2009 zu Ende. Bei dieser Konferenz kommen die Besten ihres Fachs zusammen. John Riedl, ein anerkannter Experte der Recommender Research Community gab einen Talk mit dem Titel: "Research Challenges in Recommenders". Dabei verfolgte er einen starken Praxisbezug:

  • Wie kann man sicherstellen, dass ein Recommender System strategisch sinnvoll ist?
    Bemerkung LWS: Eine Faustregel lautet folgendermassen. Nur wenn die Kundschaft UND die Produktepalette genug diversifiziert sind, lohnt sich auch ein Recommender einzusetzen. Es macht ja keinen Sinn, einem Benutzer in einem Früchteladen Bananen vorzuschlagen.
  • Dem 'Cold-Start' Problem wird eine zu hohe Bedeutung beigemessen. Unter dem 'Cold-Start' Problem versteht man die Situation, wenn ein Benutzer oder auch ein Objekt dem System das erste mal bekannt gemacht werden. Da zu diesem Zeitpunkt noch keine Benutzeraktivität / Objekthistorie vorhanden sind, kann man schlecht statistische Aussagen generieren. Dieses Problem wird bis jetzt als eines der Zentralsten in der Research Community angesehen. Riedl sagt: 'just be creative'. Er führt leider nicht genau aus, was er damit meint.
    Bemerkung LWS: Vielleicht wurde dem Problem wirklich zuviel Gewicht gegeben. Vielleicht genügt es für einen neuen Benutzer einfach mal die "Block-Busters" vorgeschlagen zu bekommen. Dies kann erstmal eine Art 'Vertrauen' zwischen dem Benutzer und dem System generieren. Denn wenn ein neuer Benutzer am Anfang nur Dinge vorgeschlagen bekommt, welche er überhaupt nicht kennt, kann dies zu Problemen führen. Eine richtige Antwort auf die Frage, inwieweit das 'Cold-Start' Problem zum Erfolg eines Recommender beiträgt, kann nur das reale Experiment geben...
  • Finde eine richtige Balance zwischen Daten und Algorithmen.
    Bemerkung LWS: Wie ich in einer früheren Publikation dargelegt habe, sind hochentwickelte Algorithmen nur in bestimmten Situation (Daten-Topologien) sinnvoll. Ansonsten reicht z.B. ein trivialer Algorithmus wie ein gewichteter Mittelwert aus.
  • Wie, wann und was soll dem Benutzer vorgeschlagen werden?
    Bemerkung LWS: Hier wird es wahrscheinlich nie eine abschliessende Anwort geben. Das richige Verhalten eines Systems gegenüber seinen Nutzern dürfte stark kontext-abhängig sein.
  • Wähle den richtigen Feedback Mechanismus.
    Bemerkung LWS: Das ist ein ganz wichtiger Punkt. Ein Beispiel ist die Rating-Skala, auf derer ein Benutzer sein Feedback gibt. Nicht immer ist es sinnvoll eine z.B. 5-stern Skala zu haben. Manchmal reicht der Feedback: like it/ don't like it, völlig aus. Auch dies ist kontext-abhängig und je nach Situtation (Daten, User etc.) zu handhaben.
  • Messe alles.
    Bemerkung LWS: Ich bezweifle stark, dass dies immer sinnvoll ist. Im Gegenteil: wir dürfen nicht vergessen, dass die generierten Daten von Recommendern mit starkem 'Rauschen' verbunden sind. Ich denke, ein zentraleres Problem ist folgendes: Lerne das relevante zu messen!

Kontakt für Anregungen und Fragen:Dr. Marcel Blattner

4.11.09


Low hanging fruits are gone! Wie in meinem letzten Beitrag über Recommender Systems dargelegt, ist die Zeit vorbei, wo man durch bessere 'prediction accuracy' jemanden aus dem Busch locken kann. Wie weiter? Um über 'prediction accuracy' hinauszukommen, müssen Modelle erstellt werden, welche das Voting-Verhalten von Menschen beschreiben. Wenn man angeben kannn, bei welchen Randbedingungen welche Daten von Benutzern generiert werden, ist man auch besser in der Lage einen optimalen Algorithmus (auf die Daten zugeschnitten) auszuwählen. Um ein Model zu erstellen sind unter anderem folgende Aspekte zu beachten: wie selbstkonsistent beurteilen Menschen Objekte, wie beeinflussen Peers die Entscheidung für oder gegen Objekte/Informationen? Von welchen Parametern sind solche Faktoren abhängig? Eines ist klar: diese Aufgabe ist nicht leicht und erfordert Wissen aus anderen Disziplinen. Low hanging fruits are gone!

Kontakt für Anregungen und Fragen:Dr. Marcel Blattner

23.10.09


Recommender Systeme: Sie sind die zukünftigen Tools, um Informationen präferenzgerecht aufzubereiten. Die letzten 10 Jahre haben sich Forscher in der Community vorallem damit beschäftigt, wie man solche Systeme in Punkto Algorithmik verbessert. Dabei hat man ein spezielles Augenmerk auf Performance und 'Prediction Accuracy' gelegt. Es gibt eine Unmenge an Publikationen über diese Themen. In den letzen 2 Jahren zeichnete sich aber die Erkenntnis ab, dass die Brauchbarkeit eines Recommender Systems nicht nur von diesen Faktoren abhängt. Zum Beispiel spielt die Diversität (neues/altbekanntes) innerhalb der Vorschlagslisten eine grosse Rolle. Die Erkenntnis ist gewachsen, dass ein erfolgreiches Recommender System zwei Aspekte erfüllen muss: a) Genauigkeit und b) individuelle Diversität in den Vorschlagslisten. Unser Labor hat kürzlich einen neuen Algorithmus entwickelt, welcher in beiden Punkten vielversprechende Resultate produziert: B-Rank.

Kontakt für Anregungen und Fragen:Dr. Marcel Blattner

07.10.09


Die neue Rubrik 'Forschungsblog' ist eröffnet.  Jede Woche werden News aus der Forscher-Community rund um das Thema Web Science vorgestellt.