Entwurf digitaler Filter für spektrometrische AnwendungenManfred U. A. Brombader Universität-Gesamthochschule-Paderborn zur Erlangung des akademischen Grades "Dr. rer. nat" vorgelegte Dissertation Paderborn 1981 Eingereicht: 14. Mai
Gutachter: Prof. Dr. H. Ziegler, Prof. Dr. J. Schröter Neu erfasste Version - kann Übertragungsfehler enthalten!1.1 Einführung
2 Rekursivdarstellung finiter Digitalfilter 2.1 Einführung
3.1 Einführung
4 Polynomfilter zur Glättung spektrometrischer Signale 4.1 Einführung
Formelsammlung
EinleitungDie Digitaltechnik hat sich zu einem unentbehrlichen Hilfsmittel der physikalischen Messtechnik entwickelt. Zu den vorteilhaften Eigenschaften, die eine digitale Messwertverarbeitung gegenüber herkömmlichen Verfahren auszeichnen, gehören unter anderem:(1) höhere GenauigkeitIn der Spektrometrie liegt eine Messung zunächst als Kurvenverlauf vor, der z. B. die Abhängigkeit irgendeiner Emissions- oder Absorptionsgröße von der Energie beschreibt. Dieser Kurvenverlauf, der sich typischerweise aus mehr oder weniger vielen Gauß- und Lorentzlinien verschiedener Lage, Breite, und Amplitude zusammensetzt, bildet die Grundlage für die Interpretation des zu untersuchenden physikalischen Phänomens. Um zu einer physikalischen Auswertung der Messung zu kommen, muss eine Datenreduktion durchgeführt werden: aus der Vielzahl der gemessenen Wertepaare sind die relevanten Informationen wie Linienanzahl, Linienlagen, Linienbreiten, und Linienintensitäten (-amplituden) zu extrahieren. Unglücklicherweise ist allen spektroskopischen Messungen ein unterschiedlich starker Rauschanteil überlagert; zusätzlich gibt es Auflösungsprobleme, wenn zwei Linien so dicht benachbart sind, dass sie visuell zu einer einzigen "verschmieren". Das Rauschen lässt sich manchmal durch einfache RC-Tiefpässe vermindern, bei älteren Messverfahren war dies oft die einzige Methode. Einem analogen Filter haften jedoch zwei entscheidende Nachteile an: die Filterung kann nur "einmal" stattfinden, nämlich während der Messung (in statu nascendi). War die Zeitkonstante zu groß eingestellt, kann ein ganzer Messablauf umsonst gewesen sein. Bei der digitalen Messwertverarbeitung hat man nachträglich die Freiheit, (fast) beliebige Filterungen so vorzunehmen, dass das Ergebnis optimal wird. Dies setzt natürlich voraus, dass das Messsignal ohne oder mit vernachlässigbarer analoger Vorbehandlung abgespeichert wurde. Der zweite Nachteil des RC-Filters, der sich ebenfalls durch digitale Verfahren vermeiden lässt, liegt in der fast undefinierbaren Verschiebung des Maximums einer symmetrischen Linie (d. h. der Linienlage) begründet. Mit digitalen Filtern lassen sich nicht nur die angeführten prinzipiellen Probleme umgehen, man kann auch bemerkenswerte quantitative Verbesserungen erzielen, wie z. B. in (Ziegler 1981) dargelegt ist. In der vorliegenden Arbeit geht es darum, digitale Filter zu entwerfen, die (1) gute Signal-Rausch-Eigenschaften aufweisen,Mit Hilfe der Least-Square-Approximation ist es möglich, ein allgemeines Verfahren zur Gewinnung rauschvermindernder Digitalfilter, insbesondere Glättungsfilter, Differenziatoren und Auflösungsverbesserer anzugeben. Durch die Anwendung orthogonaler Polynome (Hahnpolynome) ist es gelungen, eine explizite und damit benutzerfreundliche Darstellung eines besonders für die Spektrometrie geeigneten Glättungsfiltertyps zu gewinnen. Die bekannten Savitzky-Golay-Glättungsfilter (Savitzky/Golay 1964, Steinier et al. 1972, Madden 1978, Ernst 1966, Willson/Edwards 1976, Bromba/Ziegler 1981) und die finiten Tiefpässe mit maximal flachem Frequenzgang (Herrmann 1971, Bromba/Ziegler 1980) erweisen sich als Spezial- bzw. Grenzfälle dieses Filtertyps. Weiterhin wurden für die "einfachsten" dieser Glättungsfilter Rekursivdarstellungen (Bromba/Ziegler 1979) entwickelt, die bei größeren Rauschunterdrückungen eine erhebliche Rechenzeitersparnis erlauben und damit auch der Forderung (4) Genüge leisten. Die Arbeit ist hauptsächlich in drei Teilbereiche aufgegliedert. In Abschnitt 2 wird die Theorie der Rekursivdarstellungen finiter Digitalfilter auf der in (Bromba 1978, Bromba/Ziegler 1979) entwickelten Grundlage vertieft und erweitert. Die im dritten Abschnitt dargelegte Theorie der Least-Squares-Digitalfilter ist eine Verallgemeinerung des in (Bromba 1978) beschriebenen Optimierungsverfahrens für beliebige diskrete Faltungsoperationen und beliebige Orthogonalsysteme. Hierbei konnten besondere Fortschritte durch die Nutzbarmachung der Hahn- und Krawtchoukpolynome erzielt werden. Im vierten Abschnitt geht es schließlich um die Anwendung der vorgeschlagenen Hahnapproximation für digitale Filter zur Glättung spektrometrischer Signale (Spektren). Hier werden einige Beurteilungskriterien entwickelt, die einen Vergleich der verschiedenen Glättungsfilter mit polynomialer Filterfunktion erlauben. Die behandelten Glättungsfilter lassen sich auch in anderen Bereichen (Statistik, Medizin, Numerische Mathematik, Chemie usw.) gewinnbringend anwenden (Borgan 1979, Vasseur et al. 1979, Greville 1966, Greville 1974). 1 Definitionen1.1 EinführungIn den folgenden Abschnitten soll der Leser mit der Schreibweise, die dieser Arbeit zugrunde liegt und den wichtigsten mathematischen Hilfsmitteln vertraut gemacht werden.Die Schreibweise ist durchweg der modernen Analysis (einschließlich Funktionalanalysis) entlehnt (z. B. Sawyer 1978, Blatter 1977) und besitzt den Vorteil, einfach und eindeutig zu sein. Mathematisch interessierte Leser mögen tiefergehende Hintergrundinformationen der einschlägigen Literatur entnehmen (Fuchssteiner/Laugwitz 1974, Heuser 1975, Kreyszig 1978, Luenberger 1969, Zygmund 1977). Der sonst in der Theorie der digitalen Filter dominierende Gebrauch der z-Transformation (Rabiner/Gold 1975, Oppenheim/Schafer 1975, Stearns 1975, Robinson/Silva 1978, Antoniou 1979, Schüssler 1973) wurde in der vorliegenden Arbeit durch die Operatorschreibweise ersetzt. Die Begriffe "Funktion" und "Vektor" werden abwechselnd für ein und dasselbe mathematische Objekt gebraucht. Zahlreiche Sätze lassen sich unter Benutzung vorhandener Formeln durch einfaches Nachrechnen beweisen. In solchen Fällen wurde der Beweis nicht explizit hingeschrieben. Im Text nicht definierte oder erklärte Symbole sind - soweit man sie nicht als allgemein bekannt voraussetzen kann - in der Symbolliste im Anhang zusammengestellt. 1.2 RäumeWir betrachten in dieser Arbeit Messwertfolgen, die sich idealisiert als beidseitig unendlich ausgedehnte Funktionen f mit diskretem Definitions- und kontinuierlichem Wertebereich, wie man sie z. B. durch Abtastung einer zeitlich veränderlichen Messgröße erhält, darstellen lassen. Den Vektorraum (Fuchssteiner/Laugwitz 1974 S14) dieser Funktionen nennen wir ℓ.
Für den Wert von f ∈ ℓ an der Stelle k schreiben wir f [k], wobei die eckigen Klammern ein Hinweis auf den diskreten Charakter von f sein mögen. Der Raum ℓ ist im allgemeinen zu "groß",
um ein sinnvolles Arbeiten zu gestatten. Mit zusätzlichen, durch die Praxis
nahegelegten Einschränkungen, erhalten wir die Räume:
Zur Vereinfachung der Schreibweise haben
wir bereits von der folgenden Vereinbarung Gebrauch gemacht, die (wie alle
Konventionen) der gesamten Arbeit zugrunde liegt:
Soll eine diskrete Funktion f ∈
ℓ auch komplexe Werte annehmen dürfen, das heißt:
Die Bedeutung von Vℓ
Der Stern (*) in (12) bedeutet Komplexkonjugation.
ℒ2' ist ein abgeschlossener Unterraum von ℒ2.
1.3 Fouriertransformation
Die Fouriertransformation ℱ ist eine lineare isometrische isomorphe Abbildung zwischen ℓ2 und ℒ2' bzw ℓ2ℂ und ℒ2:
Die Umkehrabbildung ℱ -1 (inverse Fouriertransformation) hat die Form
Die Beschränkung auf Funktionen f
∈
ℒ2' 1.4 FunktionaleFunktionale sind Abbildungen, die einer oder mehreren Funktionen eine reelle oder komplexe Zahl zuordnen. Die wichtigsten Funktionale, mit denen wir es zu tun haben werden, sind Normen und Skalarprodukte. So lassen sich die Räume aus Definition 1.2.2 bis 1.2.4 mit Hilfe von geeigneten Normen zu Banachräumen, d. h. vollständigen normierten Vektorräumen machen. Die Vektorräume Wℓ, ℓ
Achtung: das Skalarprodukt <,>, (1),
wird manchmal (wenn ausdrücklich vermerkt!) auch als allgemeines, beliebig
zu definierendes Skalarprodukt verstanden.
Die Isometrie der Fouriertransformation kommt in den Beziehungen
die natürlich auch für f, g ∈ ℓ2 bzw. ℒ2' gelten, zum Ausdruck. (9) wird in der Theorie der Fourierreihen auch Parsevalgleichung genannt. Zur Kennzeichnung gewisser Signaleigenschaften
bedienen wir uns der Momente µm
(m-tes Moment):
Die Beschränkung auf finite Funktionen
Wℓ
(Definition 1.6.2) in Definition
1.4.3 ist häufig zu restriktiv, sie dient hier lediglich der Existenzsicherung
(Beschränktheit). Momente sind lineare Funktionale, deren Werte auf einfache
Weise aus der Fouriertransformierten
ℱ f durch Differenziation
herzuleiten sind (ℱ f(m)(ω) bezeichne die m-te Ableitung
von ℱ f an der Stelle ω):
Ist f ∈ Wℓ gar symmetrisch (Definition 1.6.2), vereinfacht sich (12) zu
1.5 OperatorenOperatoren sind Abbildungen zwischen Vektorräumen. Die Fouriertransformation ist ein bereits eingeführtes Beispiel. Die folgenden linearen Operatoren definieren wir zunächst auf ℓℂ. Dabei ist zu beachten, dass die speziellen Eigenschaften der auf Teilmenge von ℓℂ vorzunehmenden Einschränkungen dieser Operatoren von der Struktur des Raumes (Metrik) abhängen.
Die Wirkung dieser Operatoren im "Frequenzraum"
ℒ2' fassen wir, soweit sie sich anschaulich beschreiben
lässt, zusammen in
Die Operatoren S, T, U, V und W sind auf ℓ2beschränkt und damit stetig. Man erhält
W ist ein Projektor,
W:
ℓ2 → W Mit den folgenden Vertauschungsrelationen
lassen sich viele Aussagen über Digitalfilter schnell und problemlos beweisen.
Von besonderer Bedeutung sind in dieser
Arbeit die sogenannten Projektionsoperatoren
(z. B. mit P bezeichnet). Sie bilden einen Hilbertraum ℋ
in einen Unterraum von ℋ ab, den wir der Einfachheit halber Pℋ
nennen.
Ein Projektor hat nur die Eigenwerte 1
und 0. Jedes f ∈ Pℋ ist Eigenvektor zum Eigenwert
1; jedes g ∈ (Pℋ )⊥ ist Eigenvektor
zum Eigenwert 0. (Pℋ )⊥ stellt das orthogonale
Komplement von Pℋ dar. Man beachte, dass die Definition hier ganz
besonders vom gewählten Hilbertraum ℋ abhängt. Es geht nicht nur die
Grundmenge (z. B. 1.6 Digitalfilter
Ein Digitalfilter ist ein (diskreter) Faltungsoperator, denn es gilt im Fall der Konvergenz (f ∈ ℓ)
Der folgende Satz gibt an, wie sich aus
der Filterfunktion a die Beschränktheit eines Digitalfilters auf
Das "wesentliche Supremum" esssup ist
z. B. in (Fuchssteiner/Laugwitz 1974) erklärt.
Es entspricht bis auf die Eigenschaft, dass Abweichungen einer Funktion
auf einer Menge vom Maß null keinen Einfluss ausüben, genau dem Supremum.
Aus Satz 1.6.2 geht unter anderem hervor, dass die
Bedingung für Beschränktheit auf Bleibt ein beschränktes Signal f
∈ ℓ∞ beschränkt (||Af||∞ ≤
||a|| Offensichtlich lassen
sich alle Eigenschaften eines Digitalfilters aus der zugehörigen Filterfunktion
ableiten. Um zu einer weiteren Differenzierung digitaler Filter
zu kommen, definieren wir zunächst einige Funktionenklassen besonderer
Wichtigkeit.
Anders als im Kontinuierlichen gibt es
im Diskreten keine Probleme mit der Deltafunktion.
Die Deltafunktion d besitzt wie üblich die Eigenschaften
Bei Anwendung eines Digitalfilters auf
die Deltafunktion tritt als Ergebnis also die Filterfunktion hervor, womit
das Digitalfilter sein gesamtes Innenleben offenbart. Wir werden deshalb
häufig Ad anstelle von a als Filterfunktion bezeichnen,
um zusätzliche Definitionen zu ersparen.
Finite Digitalfilter haben eine Reihe von bedeutsamen Eigenschaften:
Zum Beweis von (21) sowie zur Erläuterung der Begriffe "Rauschverstärkung" und "weißes Rauschen" siehe Abschnitt 4.3. Häufig ist es sinnvoll, aus Digitalfiltern mit bekannter Filterfunktion a ≔ Ad durch Transformation Digitalfilter mit neuen Eigenschaften zu gewinnen. Wir zählen hier einige elementare Transformationen auf.
Wie alle linearen Operatoren lässt sich ein Digitalfilter auf ℓ Eine "Komposition" (Hintereinanderschaltung) von linearen Operatoren ist in dieser Schreibweise einfach durch die Matrizenmultiplikation erklärt. 2 Rekursivdarstellung Finiter Digitalfilter2.1 EinführungIn (Bromba/Ziegler 1979) wird ein Verfahren beschrieben, mit dem ein finites Digitalfilter A, dessen Filterfunktion Ad im Intervall -N,...,N ein Polynom ist, in die Form
Natürlich kann eine solche Rekursion nur dann funktionieren, wenn
Natürlich hat jedes finite Digitalfilter beliebig viele Rekursivdarstellungen. (Das sieht man, wenn man z. B. in (8) K durch M, M ∈ ℕ, ersetzt). Die Theorie der "rekursiven Digitalfilter" (Schüssler 1973 S35) lehrt uns jedoch, dass nur bei Digitalfiltern, deren Filterfunktion bereichsweise aus exponentiell gewichteten Polynomen besteht, eine Reduzierung des Rechenaufwands gegenüber der direkten Berechnung (3) und damit eine sinnvolle Rekursivdarstellung erwartet werden darf. Selbst wenn diese Voraussetzung erfüllt ist, hat man noch die Auswahl zwischen mehreren Rekursivdarstellungen. Wir wollen hier stets diejenige mit dem kleinsten Rechenaufwand betrachten. Die Entwicklung verschiedener Rekursivdarstellungen ist unter anderem in (Blum 1957, Morrison 1967, Vasseur et al. 1979, Nesline/Zarchan 1979) beschrieben. Es erübrigt sich, ein allgemeines Verfahren anzugeben, da wir, wie sich zeigen wird, alle auftretenden Möglichkeiten durch entsprechende Transformationen auf den Fall ungewichteter Polynome zurückführen können. Zunächst werfen wir noch einmal einen zusammenfassenden Blick auf die in (Bromba/Ziegler 1979) benutzte Methode. Ausgangspunkt ist ein Digitalfilter A, dessen Filterfunktion Ad in einem wenigstens einseitig begrenzten Bereich durch ein Polynom K-ten Grades dargestellt werden kann. Außerhalb dieses Bereichs mögen die Werte von Ad verschwinden. Wenden wir auf diese Filterfunktion das Digitalfilter
Eine wesentliche Vorraussetzung für die
Implementierung von Rekursivdarstellungen der Form (7) ist exakte Berechenbarkeit,
da beliebig kleine, durch Rundungs-, Überlauf- und sonstige Fehler auftretende
Rechenungenauigkeiten zur Instabilität des Algorithmus führen können.
Diese Instabilität äußert sich darin, dass das Ausgangssignal über
alle Grenzen wächst, obwohl das Eingangssignal beschränkt bleibt. Exakte
Berechenbarkeit ist im Fall (7) durch die Anwendung von Ganzzahlenarithmetik
erreichbar. Eine weitere Diskussion findet in Abschnitt
2.5 statt, siehe auch (Lynn 1978, Kurshan/Gopinath
1975, Gopinath/Kurshan 1975, Kurshan/Odlyzko
1980).
2.2 Polynomfilter
(K+1)(L+2) ist gerade die maximale Anzahl
der von null verschiedenen Koeffizienten von A'd (8) und
A''d
(9) in einer zugehörigen Rekursivdarstellung (7). Daraus folgt, dass die
Rekursivdarstellung eines Polynomfilters nicht mehr Rechenaufwand erfordert
als die nichtrekursive Implementierung. Ist die Zahl der Schnittstellen
(L+1) genau zwei und liegen diese zusätzlich bei ±N so sprechen wir von
einem einfachen Polynomfilter, da die Filterfunktion in diesem Fall durch
ein
Polynom (L=1) in Wℓ vollständig erklärt ist.
Wie bereits in 2.1 gezeigt, hat die Rekursivdarstellung eines Polynomfilters AM M-ten Grades zweckmäßigerweise die Form
Wir wollen nun untersuchen, wie sich wichtige Eigenschaften des Polynomfilters AM in der Rekursivdarstellung widerspiegeln. Da
Der Beweis benutzt die Sätze 1.5.3
und 1.6.1.
|