-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathcheck_links.py
More file actions
39 lines (34 loc) · 1.33 KB
/
check_links.py
File metadata and controls
39 lines (34 loc) · 1.33 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
import re
from urllib.parse import urlparse
LINK_CONTAINS_IP = 25
def get_base_domain(domain):
"""
Extrahiert die Basisdomain aus einem Domainnamen
(z. B. aus notice.aliexpress.com → aliexpress.com).
"""
parts = domain.split('.')
if len(parts) >= 2:
return '.'.join(parts[-2:])
return domain
def check_links(urls, expected_domain=""):
"""
Prüft die in der E-Mail gefundenen URLs.
- Wenn ein Link eine IP-Adresse enthält, wird ein hoher Score vergeben.
- Zudem werden bekannte URL-Shortener erkannt.
Externe Domains (d.h. Links, deren Basisdomain nicht expected_domain entspricht)
werden NICHT bestraft.
"""
score = 0
details = []
ip_regex = re.compile(r'https?://(?:\d{1,3}\.){3}\d{1,3}(?=/|:|$)')
url_shorteners = ["bit.ly", "tinyurl", "goo.gl", "t.co", "ow.ly"]
for url in urls:
if ip_regex.search(url):
score += LINK_CONTAINS_IP
details.append(f"Link {url} enthält eine IP-Adresse anstelle einer Domain.")
# Prüfe, ob die URL einen bekannten Kurzlink-Dienst nutzt
parsed = urlparse(url)
if any(short in parsed.netloc.lower() for short in url_shorteners):
score += 10
details.append(f"Link {url} verwendet einen URL-Shortener, was verdächtig sein kann.")
return score, details