Re: Hi all
[notmuch-archives.git] / f8 / 7b2c4fcafd458c75c3c1c3371d4daf87d2973d
1 Return-Path: <tomi.ollila@iki.fi>\r
2 X-Original-To: notmuch@notmuchmail.org\r
3 Delivered-To: notmuch@notmuchmail.org\r
4 Received: from localhost (localhost [127.0.0.1])\r
5  by arlo.cworth.org (Postfix) with ESMTP id E73936DE01EE\r
6  for <notmuch@notmuchmail.org>; Sat, 11 Jun 2016 10:09:52 -0700 (PDT)\r
7 X-Virus-Scanned: Debian amavisd-new at cworth.org\r
8 X-Spam-Flag: NO\r
9 X-Spam-Score: 0.569\r
10 X-Spam-Level: \r
11 X-Spam-Status: No, score=0.569 tagged_above=-999 required=5 tests=[AWL=-0.083,\r
12   SPF_NEUTRAL=0.652] autolearn=disabled\r
13 Received: from arlo.cworth.org ([127.0.0.1])\r
14  by localhost (arlo.cworth.org [127.0.0.1]) (amavisd-new, port 10024)\r
15  with ESMTP id yAFjy2Mk-5xX for <notmuch@notmuchmail.org>;\r
16  Sat, 11 Jun 2016 10:09:44 -0700 (PDT)\r
17 Received: from guru.guru-group.fi (guru.guru-group.fi [46.183.73.34])\r
18  by arlo.cworth.org (Postfix) with ESMTP id 988386DE01BE\r
19  for <notmuch@notmuchmail.org>; Sat, 11 Jun 2016 10:09:44 -0700 (PDT)\r
20 Received: from guru.guru-group.fi (localhost [IPv6:::1])\r
21  by guru.guru-group.fi (Postfix) with ESMTP id 30235100104;\r
22  Sat, 11 Jun 2016 20:09:29 +0300 (EEST)\r
23 From: Tomi Ollila <tomi.ollila@iki.fi>\r
24 To: Gaute Hope <eg@gaute.vetsj.com>, David Bremner <david@tethera.net>,\r
25  Austin Clements <aclements@csail.mit.edu>\r
26 Cc: notmuch <notmuch@notmuchmail.org>\r
27 Subject: Re: [PATCH] WIP: regexp matching in 'subject' and 'from'\r
28 In-Reply-To: <1465662533-astroid-3-6vuqm3zu54-1296@strange>\r
29 References: <1465265149-7174-1-git-send-email-david@tethera.net>\r
30  <1465525688-30913-1-git-send-email-david@tethera.net>\r
31  <1465547660-astroid-0-nudmv20lbk-1296@strange>\r
32  <87a8itxpu7.fsf@zancas.localnet>\r
33  <1465662533-astroid-3-6vuqm3zu54-1296@strange>\r
34 User-Agent: Notmuch/0.22+42~gafaa8cf (https://notmuchmail.org) Emacs/24.5.1\r
35  (x86_64-unknown-linux-gnu)\r
36 X-Face: HhBM'cA~<r"^Xv\KRN0P{vn'Y"Kd;zg_y3S[4)KSN~s?O\"QPoL\r
37  $[Xv_BD:i/F$WiEWax}R(MPS`^UaptOGD`*/=@\1lKoVa9tnrg0TW?"r7aRtgk[F\r
38  !)g;OY^,BjTbr)Np:%c_o'jj,Z\r
39 Date: Sat, 11 Jun 2016 20:09:28 +0300\r
40 Message-ID: <m2a8iry7nb.fsf@guru.guru-group.fi>\r
41 MIME-Version: 1.0\r
42 Content-Type: text/plain\r
43 X-BeenThere: notmuch@notmuchmail.org\r
44 X-Mailman-Version: 2.1.20\r
45 Precedence: list\r
46 List-Id: "Use and development of the notmuch mail system."\r
47  <notmuch.notmuchmail.org>\r
48 List-Unsubscribe: <https://notmuchmail.org/mailman/options/notmuch>,\r
49  <mailto:notmuch-request@notmuchmail.org?subject=unsubscribe>\r
50 List-Archive: <http://notmuchmail.org/pipermail/notmuch/>\r
51 List-Post: <mailto:notmuch@notmuchmail.org>\r
52 List-Help: <mailto:notmuch-request@notmuchmail.org?subject=help>\r
53 List-Subscribe: <https://notmuchmail.org/mailman/listinfo/notmuch>,\r
54  <mailto:notmuch-request@notmuchmail.org?subject=subscribe>\r
55 X-List-Received-Date: Sat, 11 Jun 2016 17:09:53 -0000\r
56 \r
57 On Sat, Jun 11 2016, Gaute Hope <eg@gaute.vetsj.com> wrote:\r
58 \r
59 > David Bremner writes on juni 10, 2016 13:09:\r
60 >> Gaute Hope <eg@gaute.vetsj.com> writes:\r
61 >> \r
62 >>>\r
63 >>> Cool!\r
64 >>>\r
65 >>> Would it break a lot of things if you just replace the original prefix?\r
66 >> \r
67 >> It would change the matching behaviour. I guess there are people that\r
68 >> like the current "sloppy" matching of from: and subject:.  In my\r
69 >> not-very-scientific tests, it is a factor of 5 to 10 times slower to do\r
70 >> regexp search, which makes sense because it is effectively post\r
71 >> processing the results from Xapian. At least on my system it seems fast\r
72 >> enough to be usable interactively, but that is a pretty shocking\r
73 >> performance regression. And I know there are people with more mail on\r
74 >> slower systems.\r
75 >\r
76 > Maybe we could check if the search string contains a regexp and decide\r
77 > whether to pre-process it on the background of that? I think that would\r
78 > make the interface more user-friendly. You'd just always use search\r
79 > whether you decide that you need to put in some regexp or not.\r
80 \r
81 You probably wanted to suggest that the command line handling in notmuch\r
82 goes through the search terms and potentially modify it before giving\r
83 to xapian to chew for... I think this is deliberately avoided (*) -- this\r
84 would get out of hands so easily (if we could decide syntax)...\r
85 \r
86 (*) there is some optmization done before feeding the query to xapian --\r
87 but that does not affect interface (i.e. it could be dropped and none of\r
88 the users' expectations would be broken...)\r
89 \r
90 What one can do, is write ones own wrapper around notmuch. I have one\r
91 that was written long before notmuch got date: searches (it mangles\r
92 e.g 5h.. to 1234567890.. (**) and logs search and show queries\r
93 (**) should change that to use date:... instead (i.e. date: queries w/o\r
94 date: prefix). I "suggested" subject:/one's own subject re search w// slashes/\r
95 which one could pretty easily write to the wrapper...\r
96 \r
97 Tomi\r
98 \r
99 >\r
100 >> \r
101 >>> Could it be made to work on the message body?\r
102 >> \r
103 >> See Austin's previous reply for the details, but basically no; these\r
104 >> "values" index in terms of whole strings, while the body is indexed by\r
105 >> terms (roughly, words). In principle we could add a value slot for the\r
106 >> body, but I think that would at least double the size of the database\r
107 >> (maybe more).\r
108 >> \r
109 >\r
110 > I would rather have double the db and be able wildcard beginning of\r
111 > terms. If it is not too much maintaining overhead it might be made\r
112 > optional?\r
113 >\r
114 >\r
115 > Regards, Gaute\r
116 >\r
117 > _______________________________________________\r
118 > notmuch mailing list\r
119 > notmuch@notmuchmail.org\r
120 > https://notmuchmail.org/mailman/listinfo/notmuch\r