[14.10.20] Testing
This commit is contained in:
parent
6626c0864b
commit
3c25310d76
@ -17,6 +17,7 @@ from src.utils.spamFilter import callSpamFilter
|
|||||||
from src.utils.sentimentAnalyser import callSentimentAnalyser
|
from src.utils.sentimentAnalyser import callSentimentAnalyser
|
||||||
from src.utils.activemqConnect import activeMQSender
|
from src.utils.activemqConnect import activeMQSender
|
||||||
from src.utils.jsonLogger import log
|
from src.utils.jsonLogger import log
|
||||||
|
from src.utils.whitelistedWords import filterOutTweetsWithNoneWhitelistedWords
|
||||||
|
|
||||||
from http.client import IncompleteRead
|
from http.client import IncompleteRead
|
||||||
from urllib3.exceptions import ProtocolError
|
from urllib3.exceptions import ProtocolError
|
||||||
@ -94,15 +95,18 @@ class Listener(StreamListener):
|
|||||||
if 'extended_tweet' in data['retweeted_status']:
|
if 'extended_tweet' in data['retweeted_status']:
|
||||||
#if tweet is over the 140 word limit
|
#if tweet is over the 140 word limit
|
||||||
text = data['retweeted_status']['extended_tweet']['full_text']
|
text = data['retweeted_status']['extended_tweet']['full_text']
|
||||||
|
text = filterOutTweetsWithNoneWhitelistedWords(text)
|
||||||
dumpStack.append({'type': self.hashtag, 'tweet': text})
|
dumpStack.append({'type': self.hashtag, 'tweet': text})
|
||||||
else:
|
else:
|
||||||
text = data['retweeted_status']['text']
|
text = data['retweeted_status']['text']
|
||||||
|
text = filterOutTweetsWithNoneWhitelistedWords(text)
|
||||||
dumpStack.append({'type': self.hashtag, 'tweet': text})
|
dumpStack.append({'type': self.hashtag, 'tweet': text})
|
||||||
else:
|
else:
|
||||||
# Else if a normal Tweeet
|
# Else if a normal Tweeet
|
||||||
if 'extended_tweet' in data:
|
if 'extended_tweet' in data:
|
||||||
# If tweet is over 140 word limit
|
# If tweet is over 140 word limit
|
||||||
text = data['extended_tweet']['full_text']
|
text = data['extended_tweet']['full_text']
|
||||||
|
text = filterOutTweetsWithNoneWhitelistedWords(text)
|
||||||
dumpStack.append({'type': self.hashtag, 'tweet': text})
|
dumpStack.append({'type': self.hashtag, 'tweet': text})
|
||||||
|
|
||||||
def processTweet():
|
def processTweet():
|
||||||
|
|||||||
151
src/utils/whitelistedWords.py
Normal file
151
src/utils/whitelistedWords.py
Normal file
@ -0,0 +1,151 @@
|
|||||||
|
#!/usr/bin/env python
|
||||||
|
|
||||||
|
from src.utils.jsonLogger import log
|
||||||
|
|
||||||
|
whitelist = [
|
||||||
|
"bull",
|
||||||
|
"bear",
|
||||||
|
"bullish",
|
||||||
|
"bearish",
|
||||||
|
"up",
|
||||||
|
"down",
|
||||||
|
"high",
|
||||||
|
"low",
|
||||||
|
"higher",
|
||||||
|
"lower",
|
||||||
|
"absconded",
|
||||||
|
"maximalists",
|
||||||
|
"regulate",
|
||||||
|
"infamous",
|
||||||
|
"tradehigher",
|
||||||
|
"tradelower",
|
||||||
|
"revival",
|
||||||
|
"centralized",
|
||||||
|
"decentralized",
|
||||||
|
"centralised",
|
||||||
|
"decentralised",
|
||||||
|
"decentralization",
|
||||||
|
"decentralisation",
|
||||||
|
"centralization",
|
||||||
|
"centralisation",
|
||||||
|
"bans",
|
||||||
|
"hodl",
|
||||||
|
"ambiguity",
|
||||||
|
"revolutionize",
|
||||||
|
"revolutionise",
|
||||||
|
"consolidation",
|
||||||
|
"shorts",
|
||||||
|
"longs",
|
||||||
|
"long",
|
||||||
|
"short",
|
||||||
|
"shorting",
|
||||||
|
"grow",
|
||||||
|
"volatile",
|
||||||
|
"rally",
|
||||||
|
"rallying",
|
||||||
|
"noob",
|
||||||
|
"noobs",
|
||||||
|
"innovation",
|
||||||
|
"bottom",
|
||||||
|
"top",
|
||||||
|
"topped",
|
||||||
|
"bottomed",
|
||||||
|
"upwards",
|
||||||
|
"downwards",
|
||||||
|
"invest",
|
||||||
|
"raging",
|
||||||
|
"rocketing",
|
||||||
|
"swing",
|
||||||
|
"swinging",
|
||||||
|
"stake",
|
||||||
|
"whale",
|
||||||
|
"whales",
|
||||||
|
"lull",
|
||||||
|
"moon",
|
||||||
|
"choppy",
|
||||||
|
"buy",
|
||||||
|
"buying",
|
||||||
|
"sell",
|
||||||
|
"selling",
|
||||||
|
"startselling",
|
||||||
|
"stopselling",
|
||||||
|
"startbuying",
|
||||||
|
"stopbuying",
|
||||||
|
"bitcoin",
|
||||||
|
"btc",
|
||||||
|
"eth",
|
||||||
|
"xmr",
|
||||||
|
"xrp",
|
||||||
|
"ripple",
|
||||||
|
"block",
|
||||||
|
"reward",
|
||||||
|
"airdrop",
|
||||||
|
"drop",
|
||||||
|
"raise",
|
||||||
|
"stack",
|
||||||
|
"stake",
|
||||||
|
"invest",
|
||||||
|
"pull",
|
||||||
|
"push",
|
||||||
|
"token",
|
||||||
|
"sale",
|
||||||
|
"unhappy",
|
||||||
|
"happy",
|
||||||
|
"expert",
|
||||||
|
"novice"
|
||||||
|
"passed",
|
||||||
|
"mark",
|
||||||
|
"decline",
|
||||||
|
"incline",
|
||||||
|
"fees",
|
||||||
|
"crypto",
|
||||||
|
"wallet",
|
||||||
|
"price",
|
||||||
|
"history",
|
||||||
|
"reached",
|
||||||
|
"upward",
|
||||||
|
"downward",
|
||||||
|
"trading",
|
||||||
|
"mining",
|
||||||
|
"defi",
|
||||||
|
"finance",
|
||||||
|
"blockchain",
|
||||||
|
"interest",
|
||||||
|
"alt",
|
||||||
|
"alts",
|
||||||
|
"fiat",
|
||||||
|
"fiat",
|
||||||
|
"currency",
|
||||||
|
"currencies",
|
||||||
|
"wealth",
|
||||||
|
"hype",
|
||||||
|
"hyped",
|
||||||
|
"achievement",
|
||||||
|
"platform",
|
||||||
|
"incremental",
|
||||||
|
"increment",
|
||||||
|
"decrement",
|
||||||
|
"decremental",
|
||||||
|
"success",
|
||||||
|
"loss",
|
||||||
|
"win",
|
||||||
|
"lose",
|
||||||
|
"worth",
|
||||||
|
"strongest",
|
||||||
|
"weakest",
|
||||||
|
"strong",
|
||||||
|
"weak",
|
||||||
|
"trade",
|
||||||
|
"popping",
|
||||||
|
"sucking",
|
||||||
|
"shard",
|
||||||
|
"sharding",
|
||||||
|
"industry"
|
||||||
|
]
|
||||||
|
|
||||||
|
def filterOutTweetsWithNoneWhitelistedWords(text):
|
||||||
|
if any(x in text for x in whitelist):
|
||||||
|
return text
|
||||||
|
else:
|
||||||
|
log("Tweet [{}] did not contain any keywords for it to be considered crypto related".format(text), 'WARN')
|
||||||
|
return ""
|
||||||
Loading…
x
Reference in New Issue
Block a user