Dieses Repository enthält den Code für einen Workshop im Bereich der KI in der Cybersicherheit. Der Workshop besteht aus zwei Jupyter-Notebooks, die verschiedene Aspekte der Anwendung von KI-Techniken auf die Netzwerksicherheit behandeln.
Das erste Notebook in diesem Repository behandelt die Erkennung von Netzwerkanomalien mithilfe von KI-Techniken. Das Notebook enthält den folgenden Code:
Einlesen und Plotten der Verteilung der Labels Aufteilen des Datensatzes in Trainings- und Testdaten Erstellen eines ausgeglichenen Trainingssets Klassifizieren der Daten mit einem k-Nearest-Neighbor-Modell und einem Gaussian-Naive-Bayes-Modell Aufgaben zur Erstellung eines Decision-Tree-Classifiers und eines eigenen neuronalen Netzwerks
Um diesen Workshop durchzuführen, benötigen Sie grundlegende Kenntnisse in Python und Machine Learning. Darüber hinaus benötigen Sie eine lokale Installation von Jupyter Notebook sowie die folgenden Python-Bibliotheken:
- NumPy
- Pandas
- scikit-learn
- Matplotlib
Sie können dieses Repository klonen oder als ZIP-Datei herunterladen, um den Code auf Ihrem lokalen Computer auszuführen. Stellen Sie sicher, dass Sie alle Abhängigkeiten installiert haben, bevor Sie die Notebooks ausführen.
Öffnen Sie die Jupyter-Notebooks in der Reihenfolge "Notebook 1" und "Notebook 2", um den Workshop durchzuführen. Befolgen Sie die Anweisungen in den Notebooks, um den Code auszuführen und die Aufgaben zu lösen.
Das Notebook "Spam-Ham-Classifier" ist ein Projekt, das sich mit der Klassifizierung von SMS-Texten als "Ham" oder "Spam" beschäftigtund behandelt folgende Themen:
- Entfernen von Interpunktion und Stoppwörtern
- Tokenisierung
- Bag-of-Words-Modell
- TF-IDF
- Testen eines Naive-Bayes-Modells auf Basis eines Datensatzes
Das Notebook ist in mehrere Teile unterteilt:
- Einblicke in den Datensatz und Verteilung der Zielvariable
- Preprocessing der Daten, einschließlich der Entfernung von Interpunktion und Stoppwörtern
Das Notebook bietet eine praktische Einführung in die Anwendung von Machine-Learning-Techniken auf die Klassifizierung von SMS-Texten als "Ham" oder "Spam".
Um das Notebook ausführen benötigt man eine lokale Installation von Jupyter Notebook sowie die folgenden Python-Bibliotheken:
- NumPy
- Pandas
- scikit-learn
- Matplotlib
- nltk
Viel Spaß beim Lernen!