Doppelte identische Datensätze löschen

Hallo,

ich habe das Forum durchsucht, aber finde keine Lösung für folgendes (vielleicht simples?) Problem:

In meiner eingelesenen Tabelle kommen einige identische Datensätze doppelt vor, nun würde ich gerne die doppelten rauslöschen, finde aber keine hilfreiche Syntax dafür.

Hat jemand einen Tipp für mich?

Mit freundlichen Grüßen

Susanne

Danke

Danke, das hat geklappt. Ist mir fast ein wenig peinlich, dass ich das nicht irgendwo gefunden habe, aber ich programmiere noch nicht lange mit SAS und weiß deshalb noch nicht wirklich, wo ich was finden kann.
Vielen Dank nochmal an euch beide.
Gruß Susanne

proc sort - noduprecs

Hallo Susanne,

hast Du es schonmal mit der Option noduprecs von proc sort versucht? Ebenfalls sehr hilfreich finde ich die Option nodupkeys, falls nicht alle Variablen gleich sein müssen, damit gelöscht wird.

Viele Grüße,
Barbara

Sortieren mit nodupkey

Hallo Susanne,

ich mache sowas immer mit der Option nodupkey für proc sort.
Das Ganze könnte dann beispielsweise so aussehen:

proc sort data=datei nodupkey out=datei_neu;
by allen variablen;
run;

nodupkey sorgt dafür, dass nur bzgl. der Sortiervorschrift eindeutige Datensätze in der Ausgabedatei stehen.

Viele Grüße,
Stefanie Rankl

kleine Ergänzung zu proc sort

Mann kann im proc Sort auch den _all_ Platzhalter setzen und spart sich so das Aufzählen weiterer Variablen

proc sort data=datei nodupkey out=datei_neu;
by MeineHauptSortierspalte _all_;
run;

Grüße // Martin Schäfer