Dateien trennen und zusammenfügen
Ich hoffe, die Überschrift verwirrt nicht zu sehr, aber mir ist spontan keine bessere für folgendes Problem eingefallen:
Ich habe eine Datei mit einer ID-Spalte und mehreren numerischen Werten, sagen wir 4 (könnten auch bis zu 20 werden):
ID Zahl_A Zahl_B Zahl_C Zahl_D
Ich möchte nun daraus 4 neue Dateien machen (PoolA-D), die alle Spalten behalten, aber nur die Einträge beinhalten, wo die Variable Zahl_i z.B. den zweithöchsten Wert aller Zahl_n annimmt. Ich verallgemeinere das ein wenig, da ich aus der Original-Datei auch Pools bilden will, in denen sich z.B. immer nur der dritthöchste Wert befindet.
Erklärungsbeispiel für zweithöchsten Wert: Wenn
ID Zahl_A Zahl_B Zahl_C Zahl_D
1 1 2 3 4
, dann kommt diese ID in den Pool_C.
Weiteres Beispiel:
ID Zahl_A Zahl_B Zahl_C Zahl_D
2 9 12 6 3
kommt in Pool A.
Insgesamt können bis zu 20.000.000 Einträge in den Dateien sein, aber mir geht es nicht um performance, sondern das es überhaupt läuft. :)
Nur den höchsten Wert auslesen kriege ich sogar hin, aber mit einen komplizierten Zählschleife, die ich zwecks Verwirrung hier weglasse. Was nicht klappt, ist eben der zweit-, dritt-, viert-, usw. -höchste Wert.
Gibt's da Ideen? Scheint mir etwas für Knobler zu sein. :)
