042ae29cdd48794a0336bf2fbffdbf75ee5fdc0f
[irker.git] / irkerd
1 #!/usr/bin/env python
2 """
3 irkerd - a simple IRC multiplexer daemon
4
5 Listens for JSON objects of the form {'to':<irc-url>, 'privmsg':<text>}
6 and relays messages to IRC channels. Each request must be followed by
7 a newline.
8
9 The <text> must be a string.  The value of the 'to' attribute can be a
10 string containing an IRC URL (e.g. 'irc://chat.freenet.net/botwar') or
11 a list of such strings; in the latter case the message is broadcast to
12 all listed channels.  Note that the channel portion of the URL need
13 *not* have a leading '#' unless the channel name itself does.
14
15 Options: -d sets the debug-message level (probably only of interest to
16 developers). The -V option prints the program version and exits.
17
18 Design and code by Eric S. Raymond <esr@thyrsus.com>. See the project
19 resource page at <http://www.catb.org/~esr/irker/>.
20
21 Requires Python 2.6 and the irc client library at version >= 2.0.2: see
22
23 http://pypi.python.org/pypi/irc/
24 """
25 # These things might need tuning
26
27 HOST = "localhost"
28 PORT = 6659
29
30 NAMESTYLE = "irker%03d"         # IRC nick template - must contain '%d'
31 XMIT_TTL = (3 * 60 * 60)        # Time to live, seconds from last transmit
32 PING_TTL = (15 * 60)            # Time to live, seconds from last PING
33 DISCONNECT_TTL = (24 * 60 * 60) # Time to live, seconds from last connect
34 UNSEEN_TTL = 60                 # Time to live, seconds since first request
35 CHANNEL_MAX = 18                # Max channels open per socket (default)
36 ANTI_FLOOD_DELAY = 0.5          # Anti-flood delay after transmissions, seconds
37 ANTI_BUZZ_DELAY = 0.09          # Anti-buzz delay after queue-empty check
38
39 # No user-serviceable parts below this line
40
41 # This black magic imports support for green threads (coroutines),
42 # then has kinky sex with the import library internals, replacing
43 # "threading" with a coroutine-using imposter.  Threads then become
44 # ultra-light-weight and cooperatively scheduled.
45 try:
46     import eventlet
47     eventlet.monkey_patch()
48     green_threads = True
49     # With greenlets we don't worry about thread exhaustion, only the
50     # file descriptor limit (typically 1024 on modern Unixes). Thus we
51     # can handle a lot more concurrent sessions and generate less
52     # join/leave spam under heavy load.
53     CONNECTION_MAX = 1000
54 except ImportError:
55     # Threads are more expensive if we have to use OS-level ones
56     # rather than greenlets.  We need to avoid pushing thread limits
57     # as well as fd limits.  See security.txt for discussion.
58     CONNECTION_MAX = 200
59     green_threads = False
60
61 import sys, getopt, urlparse, time, random, exceptions
62 import threading, Queue, SocketServer
63 import irc.client, logging
64 try:
65     import simplejson as json   # Faster, also makes us Python-2.4-compatible
66 except ImportError:
67     import json
68
69 version = "1.6"
70
71 # Sketch of implementation:
72 #
73 # One Irker object manages multiple IRC sessions.  It holds a map of
74 # Dispatcher objects, one per (server, port) combination, which are
75 # responsible for routing messages to one of any number of Connection
76 # objects that do the actual socket conversations.  The reason for the
77 # Dispatcher layer is that IRC daemons limit the number of channels a
78 # client (that is, from the daemon's point of view, a socket) can be
79 # joined to, so each session to a server needs a flock of Connection
80 # instances each with its own socket.
81 #
82 # Connections are timed out and removed when either they haven't seen a
83 # PING for a while (indicating that the server may be stalled or down)
84 # or there has been no message traffic to them for a while, or
85 # even if the queue is nonempty but efforts to connect have failed for
86 # a long time.
87 #
88 # There are multiple threads. One accepts incoming traffic from all servers.
89 # Each Connection also has a consumer thread and a thread-safe message queue.
90 # The program main appends messages to queues as JSON requests are received;
91 # the consumer threads try to ship them to servers.  When a socket write
92 # stalls, it only blocks an individual consumer thread; if it stalls long
93 # enough, the session will be timed out.
94 #
95 # Message delivery is thus not reliable in the face of network stalls,
96 # but this was considered acceptable because IRC (notoriously) has the
97 # same problem - there is little point in reliable delivery to a relay
98 # that is down or unreliable.
99 #
100 # This code uses only NICK, JOIN, MODE, and PRIVMSG. It is strictly
101 # compliant to RFC1459, except for the interpretation and use of the
102 # DEAF and CHANLIMIT and (obsolete) MAXCHANNELS features.  CHANLIMIT
103 # is as described in the Internet RFC draft
104 # draft-brocklesby-irc-isupport-03 at <http://www.mirc.com/isupport.html>.
105
106 class Connection:
107     def __init__(self, irkerd, servername, port):
108         self.irker = irkerd
109         self.servername = servername
110         self.port = port
111         self.nick_trial = None
112         self.connection = None
113         self.status = None
114         self.last_xmit = time.time()
115         self.last_ping = time.time()
116         self.channels_joined = []
117         self.channel_limits = {}
118         # The consumer thread
119         self.queue = Queue.Queue()
120         self.thread = None
121     def nickname(self, n=None):
122         "Return a name for the nth server connection."
123         if n is None:
124             n = self.nick_trial
125         return (NAMESTYLE % n)
126     def handle_ping(self):
127         "Register the fact that the server has pinged this connection."
128         self.last_ping = time.time()
129     def handle_welcome(self):
130         "The server says we're OK, with a non-conflicting nick."
131         self.status = "ready"
132         self.irker.debug(1, "nick %s accepted" % self.nickname())
133     def handle_badnick(self):
134         "The server says our nick has a conflict."
135         self.irker.debug(1, "nick %s rejected" % self.nickname())
136         # Randomness prevents a malicious user or bot from antcipating the
137         # next trial name in order to block us from completing the handshake.
138         self.nick_trial += random.randint(1, 3)
139         self.connection.nick(self.nickname())
140     def handle_disconnect(self):
141         "Server disconnected us for flooding or some other reason."
142         self.connection = None
143     def handle_kick(self, outof):
144         "We've been kicked."
145         self.status = "handshaking"
146         try:
147             self.channels_joined.remove(outof)
148         except ValueError:
149             self.irker.logerr("kicked by %s from %s that's not joined"
150                               % (self.servername, outof))
151         qcopy = []
152         while not self.queue.empty():
153             (channel, message) = self.queue.get()
154             if channel != outof:
155                 qcopy.append((channel, message))
156         for (channel, message) in qcopy:
157             self.queue.put((channel, message))
158         self.status = "ready"
159     def enqueue(self, channel, message):
160         "Enque a message for transmission."
161         if self.thread is None or not self.thread.is_alive():
162             self.status = "unseen"
163             self.thread = threading.Thread(target=self.dequeue)
164             self.thread.setDaemon(True)
165             self.thread.start()
166         self.queue.put((channel, message))
167     def dequeue(self):
168         "Try to ship pending messages from the queue."
169         try:
170             while True:
171                 # We want to be kind to the IRC servers and not hold unused
172                 # sockets open forever, so they have a time-to-live.  The
173                 # loop is coded this particular way so that we can drop
174                 # the actual server connection when its time-to-live
175                 # expires, then reconnect and resume transmission if the
176                 # queue fills up again.
177                 if not self.connection:
178                     self.connection = self.irker.irc.server()
179                     self.connection.context = self
180                     # Try to avoid colliding with other instances
181                     self.nick_trial = random.randint(1, 990)
182                     self.channels_joined = []
183                     # This will throw irc.client.ServerConnectionError on failure
184                     try:
185                         self.connection.connect(self.servername,
186                                             self.port,
187                                             nickname=self.nickname(),
188                                             username="irker",
189                                             ircname="irker relaying client")
190                         self.status = "handshaking"
191                         self.irker.debug(1, "XMIT_TTL bump (%s connection) at %s" % (self.servername, time.asctime()))
192                         self.last_xmit = time.time()
193                     except irc.client.ServerConnectionError:
194                         self.status = "disconnected"
195                 elif self.status == "handshaking":
196                     # Don't buzz on the empty-queue test while we're handshaking 
197                     time.sleep(ANTI_BUZZ_DELAY)
198                 elif self.queue.empty():
199                     # Queue is empty, at some point we want to time out
200                     # the connection rather than holding a socket open in
201                     # the server forever.
202                     now = time.time()
203                     if (now > self.last_xmit + XMIT_TTL \
204                            or now > self.last_ping + PING_TTL) \
205                            and self.status != "disconnected":
206                         self.irker.debug(1, "timing out inactive connection to %s at %s" % (self.servername, time.asctime()))
207                         self.connection.context = None
208                         self.connection.quit("transmission timeout")
209                         self.connection.close()
210                         self.connection = None
211                         self.status = "disconnected"
212                     else:
213                         # Prevent this thread from hogging the CPU by pausing
214                         # for just a little bit after the queue-empty check.
215                         # As long as this is less that the duration of a human
216                         # reflex arc it is highly unlikely any human will ever
217                         # notice.
218                         time.sleep(ANTI_BUZZ_DELAY)
219                 elif self.status == "disconnected" \
220                          and time.time() > self.last_xmit + DISCONNECT_TTL:
221                     # Queue is nonempty, but the IRC server might be
222                     # down. Letting failed connections retain queue
223                     # space forever would be a memory leak.
224                     self.status = "expired"
225                     break
226                 elif self.status == "unseen" \
227                          and time.time() > self.last_xmit + UNSEEN_TTL:
228                     # Nasty people could attempt a denial-of-service
229                     # attack by flooding us with requests with invalid
230                     # servernames. We guard against this by rapidly
231                     # expiring connections that have a nonempty queue but
232                     # have never had a successful open.
233                     self.status = "expired"
234                     break
235                 elif self.status == "ready":
236                     (channel, message) = self.queue.get()
237                     if channel not in self.channels_joined:
238                         self.channels_joined.append(channel)
239                         self.connection.join(channel)
240                         self.irker.debug(1, "joining %s on %s." % (channel, self.servername))
241                     for segment in message.split("\n"):
242                         self.connection.privmsg(channel, segment)
243                         time.sleep(ANTI_FLOOD_DELAY)
244                     self.last_xmit = time.time()
245                     self.irker.debug(1, "XMIT_TTL bump (%s transmission) at %s" % (self.servername, time.asctime()))
246                     self.queue.task_done()
247         except:
248             (exc_type, exc_value, exc_traceback) = sys.exc_info()
249             self.irker.logerr("exception %s in thread for %s" % \
250                               (exc_type, self.servername))
251     def live(self):
252         "Should this connection not be scavenged?"
253         return self.status != "expired"
254     def joined_to(self, channel):
255         "Is this connection joined to the specified channel?"
256         return channel in self.channels_joined
257     def accepting(self, channel):
258         "Can this connection accept a join of this channel?"
259         if self.channel_limits:
260             match_count = 0
261             for already in self.channels_joined:
262                 if already[0] == channel[0]:
263                     match_count += 1
264             return match_count < self.channel_limits.get(channel[0], CHANNEL_MAX)
265         else:
266             return len(self.channels_joined) < CHANNEL_MAX
267
268 class Target():
269     "Represent a transmission target."
270     def __init__(self, url):
271         parsed = urlparse.urlparse(url)
272         irchost, _, ircport = parsed.netloc.partition(':')
273         if not ircport:
274             ircport = 6667
275         self.servername = irchost
276         # IRC channel names are case-insensitive.  If we don't smash
277         # case here we may run into problems later. There was a bug
278         # observed on irc.rizon.net where an irkerd user specified #Channel,
279         # got kicked, and irkerd crashed because the server returned
280         # "#channel" in the notification that our kick handler saw.
281         self.channel = parsed.path.lstrip('/').lower()
282         if self.channel and self.channel[0] not in "#&+":
283             self.channel = "#" + self.channel
284         self.port = int(ircport)
285     def valid(self):
286         "Both components must be present for a valid target."
287         return self.servername and self.channel
288     def server(self):
289         "Return a hashable tuple representing the destination server."
290         return (self.servername, self.port)
291
292 class Dispatcher:
293     "Manage connections to a particular server-port combination."
294     def __init__(self, irkerd, servername, port):
295         self.irker = irkerd
296         self.servername = servername
297         self.port = port
298         self.connections = []
299     def dispatch(self, channel, message):
300         "Dispatch messages for our server-port combination."
301         connections = [x for x in self.connections if x.live()]
302         eligibles = [x for x in connections if x.joined_to(channel)] \
303                     or [x for x in connections if x.accepting(channel)]
304         if not eligibles:
305             newconn = Connection(self.irker,
306                                  self.servername,
307                                  self.port)
308             self.connections.append(newconn)
309             eligibles = [newconn]
310         eligibles[0].enqueue(channel, message)
311     def live(self):
312         "Does this server-port combination have any live connections?"
313         self.connections = [x for x in self.connections if x.live()]
314         return len(self.connections) > 0
315     def last_xmit(self):
316         "Return the time of the most recent transmission."
317         return max([x.last_xmit for x in self.connections])
318
319 class Irker:
320     "Persistent IRC multiplexer."
321     def __init__(self, debuglevel=0):
322         self.debuglevel = debuglevel
323         self.irc = irc.client.IRC()
324         self.irc.add_global_handler("ping", self._handle_ping)
325         self.irc.add_global_handler("welcome", self._handle_welcome)
326         self.irc.add_global_handler("erroneusnickname", self._handle_badnick)
327         self.irc.add_global_handler("nicknameinuse", self._handle_badnick)
328         self.irc.add_global_handler("nickcollision", self._handle_badnick)
329         self.irc.add_global_handler("unavailresource", self._handle_badnick)
330         self.irc.add_global_handler("featurelist", self._handle_features)
331         self.irc.add_global_handler("disconnect", self._handle_disconnect)
332         self.irc.add_global_handler("kick", self._handle_kick)
333         thread = threading.Thread(target=self.irc.process_forever)
334         thread.setDaemon(True)
335         self.irc._thread = thread
336         thread.start()
337         self.servers = {}
338     def logerr(self, errmsg):
339         "Log a processing error."
340         sys.stderr.write("irkerd: " + errmsg + "\n")
341     def debug(self, level, errmsg):
342         "Debugging information."
343         if self.debuglevel >= level:
344             sys.stderr.write("irkerd: %s\n" % errmsg)
345     def _handle_ping(self, connection, _event):
346         "PING arrived, bump the last-received time for the connection."
347         if connection.context:
348             connection.context.handle_ping()
349     def _handle_welcome(self, connection, _event):
350         "Welcome arrived, nick accepted for this connection."
351         if connection.context:
352             connection.context.handle_welcome()
353     def _handle_badnick(self, connection, _event):
354         "Nick not accepted for this connection."
355         if connection.context:
356             connection.context.handle_badnick()
357     def _handle_features(self, connection, event):
358         "Determine if and how we can set deaf mode."
359         if connection.context:
360             cxt = connection.context
361             for lump in event.arguments():
362                 if lump.startswith("DEAF="):
363                     connection.mode(cxt.nickname(), "+"+lump[5:])
364                 elif lump.startswith("MAXCHANNELS="):
365                     m = int(lump[12:])
366                     for pref in "#&+":
367                         cxt.channel_limits[pref] = m
368                     self.debug(1, "%s maxchannels is %d"
369                                % (connection.server, m))
370                 elif lump.startswith("CHANLIMIT=#:"):
371                     limits = lump[10:].split(",")
372                     try:
373                         for token in limits:
374                             (prefixes, limit) = token.split(":")
375                             limit = int(limit)
376                             for c in prefixes:
377                                 cxt.channel_limits[c] = limit
378                         self.debug(1, "%s channel limit map is %s"
379                                    % (connection.server, cxt.channel_limits))
380                     except ValueError:
381                         self.logerr("ill-formed CHANLIMIT property")
382     def _handle_disconnect(self, connection, _event):
383         "Server hung up the connection."
384         self.debug(1, "server %s disconnected" % connection.server)
385         if connection.context:
386             connection.context.handle_disconnect()
387     def _handle_kick(self, connection, event):
388         "Server hung up the connection."
389         self.debug(1, "irker has been kicked from %s on %s" % (event.target(), connection.server))
390         if connection.context:
391             connection.context.handle_kick(event.target())
392     def handle(self, line):
393         "Perform a JSON relay request."
394         try:
395             request = json.loads(line.strip())
396             if not isinstance(request, dict):
397                 self.logerr("request is not a JSON dictionary: %r" % request)
398             elif "to" not in request or "privmsg" not in request:
399                 self.logerr("malformed request - 'to' or 'privmsg' missing: %r" % request)
400             else:
401                 channels = request['to']
402                 message = request['privmsg']
403                 if type(channels) not in (type([]), type(""), type(u"")):
404                     self.logerr("malformed request - unexpected channel type: %r" % channels)
405                 if type(message) not in (type(""), type(u"")):
406                     self.logerr("malformed request - unexpected message type: %r" % message)
407                 else:
408                     if type(channels) != type([]):
409                         channels = [channels]
410                     for url in channels:
411                         if not type(url) in (type(""), type(u"")): 
412                             self.logerr("malformed request - URL has unexpected type: %r" % url)
413                         else:
414                             target = Target(url)
415                             if not target.valid():
416                                 return
417                             if target.server() not in self.servers:
418                                 self.servers[target.server()] = Dispatcher(self, target.servername, target.port)
419                             self.servers[target.server()].dispatch(target.channel, message)
420                             # GC dispatchers with no active connections
421                             servernames = self.servers.keys()
422                             for servername in servernames:
423                                 if not self.servers[servername].live():
424                                     del self.servers[servername]
425                             # If we might be pushing a resource limit
426                             # even after garbage collection, remove a
427                             # session.  The goal here is to head off
428                             # DoS attacks that aim at exhausting
429                             # thread space or file descriptors.  The
430                             # cost is that attempts to DoS this
431                             # service will cause lots of join/leave
432                             # spam as we scavenge old channels after
433                             # connecting to new ones. The particular
434                             # method used for selecting a session to
435                             # be terminated doesn't matter much; we
436                             # choose the one longest idle on the
437                             # assumption that message activity is likely
438                             # to be clumpy.
439                             oldest = None
440                             oldtime = float("inf")
441                             if len(self.servers) >= CONNECTION_MAX:
442                                 for (name, server) in self.servers.items():
443                                     if server.last_xmit() < oldtime:
444                                         oldest = name
445                                         oldtime = server.last_xmit()
446                                 del self.servers[oldest]
447         except ValueError:
448             self.logerr("can't recognize JSON on input: %r" % line)
449         except RuntimeError:
450             self.logerr("wildly malformed JSON blew the parser stack.")
451
452 class IrkerTCPHandler(SocketServer.StreamRequestHandler):
453     def handle(self):
454         while True:
455             line = self.rfile.readline()
456             if not line:
457                 break
458             irker.handle(line.strip())
459
460 class IrkerUDPHandler(SocketServer.BaseRequestHandler):
461     def handle(self):
462         data = self.request[0].strip()
463         #socket = self.request[1]
464         irker.handle(data)
465
466 if __name__ == '__main__':
467     debuglvl = 0
468     (options, arguments) = getopt.getopt(sys.argv[1:], "d:V")
469     for (opt, val) in options:
470         if opt == '-d':         # Enable debug/progress messages
471             debuglvl = int(val)
472             if debuglvl > 1:
473                 logging.basicConfig(level=logging.DEBUG)
474         elif opt == '-V':       # Emit version and exit
475             sys.stdout.write("irkerd version %s\n" % version)
476             sys.exit(0)
477     irker = Irker(debuglevel=debuglvl)
478     irker.debug(1, "irkerd version %s" % version)
479     tcpserver = SocketServer.TCPServer((HOST, PORT), IrkerTCPHandler)
480     udpserver = SocketServer.UDPServer((HOST, PORT), IrkerUDPHandler)
481     for server in [tcpserver, udpserver]:
482         server = threading.Thread(target=server.serve_forever)
483         server.setDaemon(True)
484         server.start()
485     try:
486         while True:
487             time.sleep(10)
488     except KeyboardInterrupt:
489         raise SystemExit(1)
490
491 # end