Mario Alejandro Garcia, Maria de la Paz Gimenez Pecci, Juan Bautista Cabral, Adrian Nieto Castillo und Irma Graciela Laguna
Die genetische Variabilität von Individuen derselben Art kann durch Netzwerke untersucht werden, die die genetischen Distanzen zwischen ihnen darstellen. Wir haben den Fall des Mal de Rio Cuarto-Virus (MRCV) untersucht, Distanzmaße zwischen Genomprofilen verschiedener Individuen definiert und ein Netzwerk von Haplotypen erstellt. Die topologischen Eigenschaften des Netzwerks wurden analysiert und dies wurde in zwei Dimensionen untersucht, wodurch Raum-Zeit-Umgebungen gebildet wurden. Die Untersuchung führte zu der Beobachtung, dass in den ersten getesteten Erntejahren die Anzahl der Haplotypen und die Distanz zwischen ihnen größer war als in den darauffolgenden Ernten. Für jede Umgebung wurde ein Variabilitätsindikator berechnet und mit seinem erwarteten Wert verglichen, was die während der Untersuchung gemachte Beobachtung bestätigte und zu dem Schluss führte, dass die Virusvariabilität nach einer Epidemie im Erntejahr 1996-97 abnahm. Eine Analyse der Variabilität von MRCV durch Haplotyp-Netzwerke wird vorgestellt. Wir schlagen die Verwendung dieses Tools vor, das in KDD-Prozessen ungewöhnlich ist und einen neuen Ansatz bietet, der die Konzepte der Wissensdarstellung, strukturierten Datenmodellierung, Visualisierung, Erkundung und interaktiven Entdeckung berücksichtigt.
Der Hauptbeitrag dieses Falls zum KDD-Prozess ist der Vorschlag der interaktiven Erkundung von Netzwerken, der sich als intuitiv und für die Analyse einfach anzuwenden erwies.