Re: [PATCH] WIP: regexp matching in 'subject' and 'from'
authorDavid Bremner <david@tethera.net>
Fri, 10 Jun 2016 11:09:36 +0000 (08:09 +2100)
committerW. Trevor King <wking@tremily.us>
Sat, 20 Aug 2016 23:22:02 +0000 (16:22 -0700)
b4/7fb393eff72b4c089745b7af0bfa37c6eed4f1 [new file with mode: 0644]

diff --git a/b4/7fb393eff72b4c089745b7af0bfa37c6eed4f1 b/b4/7fb393eff72b4c089745b7af0bfa37c6eed4f1
new file mode 100644 (file)
index 0000000..9852b6d
--- /dev/null
@@ -0,0 +1,76 @@
+Return-Path: <david@tethera.net>\r
+X-Original-To: notmuch@notmuchmail.org\r
+Delivered-To: notmuch@notmuchmail.org\r
+Received: from localhost (localhost [127.0.0.1])\r
+ by arlo.cworth.org (Postfix) with ESMTP id E4B576DE0130\r
+ for <notmuch@notmuchmail.org>; Fri, 10 Jun 2016 04:09:54 -0700 (PDT)\r
+X-Virus-Scanned: Debian amavisd-new at cworth.org\r
+X-Spam-Flag: NO\r
+X-Spam-Score: -0.011\r
+X-Spam-Level: \r
+X-Spam-Status: No, score=-0.011 tagged_above=-999 required=5\r
+ tests=[AWL=-0.000, SPF_PASS=-0.001, T_RP_MATCHES_RCVD=-0.01]\r
+ autolearn=disabled\r
+Received: from arlo.cworth.org ([127.0.0.1])\r
+ by localhost (arlo.cworth.org [127.0.0.1]) (amavisd-new, port 10024)\r
+ with ESMTP id PZu8NoImkOhO for <notmuch@notmuchmail.org>;\r
+ Fri, 10 Jun 2016 04:09:47 -0700 (PDT)\r
+Received: from fethera.tethera.net (fethera.tethera.net [198.245.60.197])\r
+ by arlo.cworth.org (Postfix) with ESMTPS id 0DEB96DE0032\r
+ for <notmuch@notmuchmail.org>; Fri, 10 Jun 2016 04:09:45 -0700 (PDT)\r
+Received: from remotemail by fethera.tethera.net with local (Exim 4.84)\r
+ (envelope-from <david@tethera.net>)\r
+ id 1bBKJY-0000qP-RE; Fri, 10 Jun 2016 07:09:24 -0400\r
+Received: (nullmailer pid 24932 invoked by uid 1000);\r
+ Fri, 10 Jun 2016 11:09:36 -0000\r
+From: David Bremner <david@tethera.net>\r
+To: Gaute Hope <eg@gaute.vetsj.com>, Austin Clements <aclements@csail.mit.edu>\r
+Cc: sfischme@uwaterloo.ca, notmuch <notmuch@notmuchmail.org>\r
+Subject: Re: [PATCH] WIP: regexp matching in 'subject' and 'from'\r
+In-Reply-To: <1465547660-astroid-0-nudmv20lbk-1296@strange>\r
+References: <1465265149-7174-1-git-send-email-david@tethera.net>\r
+ <1465525688-30913-1-git-send-email-david@tethera.net>\r
+ <1465547660-astroid-0-nudmv20lbk-1296@strange>\r
+User-Agent: Notmuch/0.22+28~gb9bf3f4 (http://notmuchmail.org) Emacs/24.5.1\r
+ (x86_64-pc-linux-gnu)\r
+Date: Fri, 10 Jun 2016 08:09:36 -0300\r
+Message-ID: <87a8itxpu7.fsf@zancas.localnet>\r
+MIME-Version: 1.0\r
+Content-Type: text/plain\r
+X-BeenThere: notmuch@notmuchmail.org\r
+X-Mailman-Version: 2.1.20\r
+Precedence: list\r
+List-Id: "Use and development of the notmuch mail system."\r
+ <notmuch.notmuchmail.org>\r
+List-Unsubscribe: <https://notmuchmail.org/mailman/options/notmuch>,\r
+ <mailto:notmuch-request@notmuchmail.org?subject=unsubscribe>\r
+List-Archive: <http://notmuchmail.org/pipermail/notmuch/>\r
+List-Post: <mailto:notmuch@notmuchmail.org>\r
+List-Help: <mailto:notmuch-request@notmuchmail.org?subject=help>\r
+List-Subscribe: <https://notmuchmail.org/mailman/listinfo/notmuch>,\r
+ <mailto:notmuch-request@notmuchmail.org?subject=subscribe>\r
+X-List-Received-Date: Fri, 10 Jun 2016 11:09:55 -0000\r
+\r
+Gaute Hope <eg@gaute.vetsj.com> writes:\r
+\r
+>\r
+> Cool!\r
+>\r
+> Would it break a lot of things if you just replace the original prefix?\r
+\r
+It would change the matching behaviour. I guess there are people that\r
+like the current "sloppy" matching of from: and subject:.  In my\r
+not-very-scientific tests, it is a factor of 5 to 10 times slower to do\r
+regexp search, which makes sense because it is effectively post\r
+processing the results from Xapian. At least on my system it seems fast\r
+enough to be usable interactively, but that is a pretty shocking\r
+performance regression. And I know there are people with more mail on\r
+slower systems.\r
+\r
+> Could it be made to work on the message body?\r
+\r
+See Austin's previous reply for the details, but basically no; these\r
+"values" index in terms of whole strings, while the body is indexed by\r
+terms (roughly, words). In principle we could add a value slot for the\r
+body, but I think that would at least double the size of the database\r
+(maybe more).\r