Design of a Virtual Auditorium

Bericht über eine Publikation von Milton Chen (Stanford University)


LMU München
Institut für Informatik
Hauptseminar "Disappearing Computer"
Referent: Michael Müller
Sommersemester 2003
12.06.2003

Milton Chen  "Design of a Virtual Auditorium" ACM Multimedia 2001





Überblick

Bei dem Forschungsprojekt wurde ein Videokonferenzsystem entwickelt, das möglichst optimales, dialog-basiertes Distance Learning ermöglichen soll.


1. Einführung in Distance Learning

Definition
“Lehr- und Lernform, bei denen der Dozent und die Lernenden räumlich getrennt voneinander sind und demnach die Kommunikation der Personen über technische Hilfsmittel abläuft.“

  • Lernprozesse erfolgen auf größere Entfernung
  • Dozent und Studenten kommunizieren räumlich getrennt voneinander
  • Meistens realisiert über Videokonferenzsystem
  • Interaktivität und Multimedia-Möglichkeiten
  • Auch geeignet für Firmenvorträge oder Fortbildungen für Mitarbeiter

Vorteile:

  • Reduzierung der Kosten
  • Keine überfüllten Hörsäle
  • Zeitsparend
  • Leute in strukturschwachen Ländern können interaktiv teilnehmen

Nachteile:

  • Ablenkung in den eigenen 4 Wänden
  • Wenig persönlicher Kontakt
  • schneller, nicht ganz billiger Internetanschluss wird benötigt
  • Lehrmaterial muss neu konzipiert und mediengerecht aufbereitet werden

 

 

Previous Work: Forum

  • Vortrag mit Folien über ein Videokonferenzsystem
  • Zuhörer können Referent sehen
  • Referent kann in Folien reinzeichnen
  • Referent kann Videos zeigen
  • Zuhörer können Folien abspeichern
  • Zuhörer können Fragen stellen

Nachteile:

  • Referent kann seine Zuhörer nicht sehen
  • Um zu Wort zu kommen, muss der Zuhörer erst einen Knopf drücken

    => Spontane Reaktionen unmöglich (z.B. Gelächter oder Applaus)

 

 

Previous Work: TELEP

  • Vortrag über Videokonferenzsystem
  • Zuhörer können den Referent sehen
  • Referent kann Videos zeigen
  • Zuhörer können Fragen stellen
  • Bis zu 38 Zuhörer möglich

Nachteil:

  • 10 bis 15 Sekunden Verzögerung möglich wegen grosser Bandbreite für viele kleine Videos der Zuhörer

    => lange Verzögerung macht ein Videokonferenzsystem fast unbrauchbar

 

 

Previous Work: FernUni Hagen

  • Teilnehmerzahlen in den letzten Jahren auf 55.000 angestiegen
  • optimal für Berufstätige, Schwangere, Studierende im Ausland, Behinderte, ...

Alle Funktionen einer realen Universität im Lehrbetrieb werden über Kommunikationsnetze verfügbar gemacht:

  • Das Lehr- sowie das Betreuungsangebot
  • Intensive Kommunikationsmöglichkeiten und soziale Kontakte
  • Unterstützung von Gruppenarbeit über das Netz
  • Zugang zu Bibliotheken und zu verteilten Informationsressourcen

Virtuelle Vorlesungen, Übungen, Seminare und Kurse in den Fachrichtungen Wirtschaftswissenschaften, Informatik, Elektrotechnik, Mathematik, Rechts- Kultur- und Sozialwissenschaften sowie Studienangebote für Blinde und Sehbehinderte (Reihenfolge nach Anzahl der Studierenden)

 

 

Zusammenfassung allgemeiner Nachteile

  • Dozent kann seine Zuhörer nicht sehen
  • keine spontanen Reaktionen möglich („press-button-to-talk usage model“)

    => Dozent vermisst verbales und visuelles Feedback

  • Verzögerung beim Audio- oder Videostream
  • Kein direkter Blickkontakt möglich
  • Kein dialog-basiertes Lernen wie in einer realen Vorlesung

    => Milton Chen versucht mit seinem Projekt „Design of a Virtual Auditorium“ die Nachteile der bisherigen Videokonferenzsysteme zu beseitigen, um ein optimales dialog-basiertes Distance Learning zu ermöglichen.

 

 

 

2. Aufbau des virtuellen Hörsaals

Übersicht

 

 

Display Wall

  • Display Wall von mehreren Rechnern realisiert
  • 3 Bereiche : Pro Bereich eine Kamera und ein Lautsprecher (Mono)
  • In jedem Bereich 8 Studenten => insgesamt 24 Studenten
  • Sprechender Student wird im „visual teleprompter“ seines Bereichs dargestellt
  • Anschauungsmaterial auf dem „visual teleprompter"

 

Control Panel

  • Zur Steuerung und zur Anzeige von Anschauungsmaterial
  • Kabellose Maus und Tastatur als Steuer- und Eingabegeräte
  • Ändern der Anordnung der Studenten auf der Display Wall
  • Eingebautes Mikrofon

 

 

Student's Monitor

  • Studenten vor PCs mit Webcam, Headset und schneller Internetanbindung
  • Dozent nicht anders dargestellt, um Diskussionen unter Studenten anzuregen
  • Studenten können interaktiv teilnehmen ohne Knopf zu drücken
  • Bei Problemen mit Bandbreite nur Bild des Dozenten mit voller frame rate gerendert, andere Studenten nur alle paar Sekunden

 

 

Eye Contact

  • Direkter Blickkontakt als wichtiges Kommunikationsmittel
  • Direkter Blickkontakt mit einem Student, mit einer Gruppe von Studenten oder mit allen gleichzeitig („directed gaze technique“)
  • Sprechender Student auf „visual teleprompter“ => direkter Blickkontakt mit Dozenten
  • Dozent kann auch nicht sprechende Studenten per Doppelklick auf den „visual teleprompter“ versetzen und Blickkontakt aufnehmen
  • Nur 2 Kameras nötig, um direkten Blickkontakt zu ermöglichen

 

 


Der Dozent schaut auf die mittlere Kamera

3. Verwendete Software

Design-Ziele

  • Audio-Stream mit Telefonqualität und Video-Stream mit Fernsehqualität
  • Geringere Anforderung an die Bandbreite als die gängigen kommerziellen Videokonferenzsysteme
  • Nahtlose Benutzeroberfläche, die die maschinellen Grenzen der Hardware verschwinden lässt
  • Modulare Architektur für komponentenweises Aufrüsten und für den schnellen Bau eines Prototyps

 

Probleme

  • Videokonferenz mit vielen Teilnehmern schwierig zu realisieren
  • zu hohe Anforderungen an Bandbreite und Leistung des Computers
  • Videokonferenz mit 20 Studenten über NetMeeting benötigt eine Band- breite von 200 Mbps

    => Kompression notwendig (z.B. MPEG-4)

 

Grenzen der Hardware

  • Einzelner PC heute von der Hardware her noch nicht in der Lage eine grosse Anzahl Video Streams mit guter Qualität zu dekomprimieren

    => Computer werden zusammengeschalten und Output wird auf ein einziges Display gesteuert

 

 

Audio Streaming

  • AuCap filter (Audio Capturing Filter)
    Erhält Daten vom Mikrofon über die Soundkarte in Paketen von 30 ms
  • AuSend filter (Audio Send Filter)
    Schickt jedes Paket über UDP unicast oder multicast
  • AuRecv filter (Audio Receive Filter)
    Empfängt Pakete und leitet Daten sofort an den AuRender filter
  • AuRender filter (Audio Render Filter)
    Enthält Playback-Puffer, der Pakete speichert bis Puffer 200 ms voll Dann Wiedergabe bis Puffer noch 60 ms enthält

Video Streaming

  • ViCap filter (Video Capture Filter)
    Erfasst Daten von jeder Video-Capture-Card oder Kamera
  • ViCod filter (Video Coding Filter)
    Komprimiert Daten. Effizient: MPEG-4 (100 Kbps für 320x240x15 fps)
  • ViSend filter (Video Send Filter)
    Sendet Daten über UDP unicast oder multicast
  • ViRecv filter (Video Receive Filter)
    Empfängt Daten in jedem komprimierten Format und leitet sie an Decoder
  • ViDec filter (Video Decoding Filter)
    Decodiert die komprimierten Daten mit entsprechendem Algorithmus
  • ViRender filter (Video Render Filter)
    Rendert das Video zu einem beliebig geformten Fenster

 

4. Nutzerstudien

Ideale Größe der Video-Darstellung

  • Mit 12 Testpersonen durchgeführte Studie, um die ideale und die minimal annehmbare Größe für die Darstellung eines Studenten zu finden

    Ergebnis:
    Durchschnitt der minimal annehmbaren Größe beträgt einen Blickwinkel von 6 Grad.
    Der für die ideale Größe benötigte Winkel liegt bei 14 Grad (fast Lebensgröße)

 

 

Bestimmung des max. Winkels für direkten Blickkontakt

  • Mit 8 Testpersonen durchgeführte Studie zur Bestimmung des maximalen Winkels zwischen Display und Kamera, sodass noch direkter Blickkontakt gewährleistet ist.

    Ergebnis:
    Alle Testpersonen: Bei Winkelabweichung von 3 Grad direkter Blickkontakt
    Bei maximalen Winkel, der noch Blickkontakt bietet, variierten Ergebnisse stark.
    Nicht bestimmte Winkelzahl gewährleistet Blickkontakt, sondern „Winkelbereich“.

    => Schwer als Testperson die genaue Grenze zu finden


 

 

5. Fazit

  • Innerhalb von 18 Monaten wurden der Hörsaal aufgebaut, die Videokonferenzsoftware geschrieben und die Parameter optimiert.

  • Das Virtual Auditorium wurde aufgebaut, um der Annahme nachzugehen, ob dialog-basiertes Distance-Teaching möglich, bzw. besser möglich ist, wenn der Dozent die Studenten und die Studenten sich auch gegenseitig sehen und hören können. Die weitere Annahme war, dass die Möglichkeit des direkten Blickkontakts sich ebenfalls positiv auf die Lernsituation auswirkt.

  • Versuche dazu werden zur Zeit in den USA, in Schweden, Deutschland und Japan durchgeführt.

  • Videokonferenzsysteme wie das Virtual Auditorium werden in Zukunft eine immer größere Rolle spielen.