]> git.rkrishnan.org Git - tahoe-lafs/tahoe-lafs.git/blob - NEWS
42fdd7cefe22cdd4f1c4b64f6a652ce44af15773
[tahoe-lafs/tahoe-lafs.git] / NEWS
1 User visible changes in Tahoe-LAFS.  -*- outline; coding: utf-8 -*-
2
3 * Release 1.7.1 (2010-07-17)
4
5 ** Bugfixes and Improvements
6
7  - Fix bug where server version number was always 0 on the welcome page (#1067)
8  - Fix minor layout issue in the Web User Interface with Internet Explorer
9    (#1097)
10  - Add new command-line command "tahoe unlink" as a synonym for "tahoe rm"
11    (#1072)
12  - The FTP frontend now encrypts its temporary files, protecting their contents
13    from an attacker who is able to read the disk. (#1083)
14  - Fix rarely-encountered incompatibility between Twisted logging utility and
15    the new unicode support added in v1.7.0 (#1099)
16
17 * Release 1.7.0 (2010-06-18)
18
19 ** New Features
20
21 *** SFTP support
22
23 Your Tahoe-LAFS gateway now acts like a full-fledged SFTP server.  It has been
24 tested with sshfs to provide a virtual filesystem in Linux.  Many users have
25 asked for this feature.  We hope that it serves them well! See the
26 docs/frontends/FTP-and-SFTP.txt document to get started.
27
28 *** support for non-ASCII character encodings
29
30 Tahoe-LAFS now correctly handles filenames containing non-ASCII characters on
31 all supported platforms:
32
33  - when reading files in from the local filesystem (such as when you run "tahoe
34    backup" to back up your local files to a Tahoe-LAFS grid);
35
36  - when writing files out to the local filesystem (such as when you run "tahoe
37    cp -r" to recursively copy files out of a Tahoe-LAFS grid);
38
39  - when displaying filenames to the terminal (such as when you run "tahoe ls"),
40    subject to limitations of the terminal and locale;
41
42  - when parsing command-line arguments, except on Windows.
43
44 *** Servers of Happiness
45
46 Tahoe-LAFS now measures during immutable file upload to see how well
47 distributed it is across multiple servers. It aborts the upload if the pieces
48 of the file are not sufficiently well-distributed.
49
50 This behavior is controlled by a configuration parameter called "servers of
51 happiness". With the default settings for its erasure coding, Tahoe-LAFS
52 generates 10 shares for each file, such that any 3 of those shares are
53 sufficient to recover the file. The default value of "servers of happiness" is
54 7, which means that Tahoe-LAFS will guarantee that there are at least 7 servers
55 holding some of the shares, such that any 3 of those servers can completely
56 recover your file.
57
58 The new upload code also distributes the shares better than the previous
59 version in some cases and takes better advantage of pre-existing shares (when a
60 file has already been previously uploaded). See the architecture.txt document
61 [3] for details.
62
63 ** Bugfixes and Improvements
64
65  - Premature abort of upload if some shares were already present and some
66    servers fail. (#608)
67  - python ./setup.py install -- can't create or remove files in install
68    directory. (#803)
69  - Network failure => internal TypeError. (#902)
70  - Install of Tahoe on CentOS 5.4. (#933)
71  - CLI option --node-url now supports https url. (#1028)
72  - HTML/CSS template files were not correctly installed under Windows. (#1033)
73  - MetadataSetter does not enforce restriction on setting "tahoe" subkeys.
74    (#1034)
75  - ImportError: No module named setuptools_darcs.setuptools_darcs. (#1054)
76  - Renamed Title in xhtml files. (#1062)
77  - Increase Python version dependency to 2.4.4, to avoid a critical CPython
78    security bug. (#1066)
79  - Typo correction for the munin plugin tahoe_storagespace. (#968)
80  - Fix warnings found by pylint. (#973)
81  - Changing format of some documentation files. (#1027)
82  - the misc/ directory was tied up. (#1068)
83  - The 'ctime' and 'mtime' metadata fields are no longer written except by
84    "tahoe backup". (#924)
85  - Unicode filenames in Tahoe-LAFS directories are normalized so that names
86    that differ only in how accents are encoded are treated as the same. (#1076)
87  - Various small improvements to documentation. (#937, #911, #1024, #1082)
88
89 ** Removals
90
91 The 'tahoe debug consolidate' subcommand (for converting old allmydata Windows
92 client backups to a newer format) has been removed.
93
94 ** Dependency Updates
95
96 the Python version dependency is raised to 2.4.4 in some cases (2.4.3 for
97   Redhat-based Linux distributions, 2.4.2 for UCS-2 builds) (#1066)
98 pycrypto >= 2.0.1
99 pyasn1 >= 0.0.8a
100 mock (only required by unit tests)
101
102 * Release 1.6.1 (2010-02-27)
103
104 ** Bugfixes
105
106 *** Correct handling of Small Immutable Directories
107
108 Immutable directories can now be deep-checked and listed in the web UI in
109 all cases. (In v1.6.0, some operations, such as deep-check, on a directory
110 graph that included very small immutable directories, would result in an
111 exception causing the whole operation to abort.) (#948)
112
113 ** Usability Improvements
114
115 Improved user interface messages and error reporting. (#681, #837, #939)
116
117 The timeouts for operation handles have been greatly increased, so that
118 you can view the results of an operation up to 4 days after it has
119 completed. After viewing them for the first time, the results are
120 retained for a further day. (#577)
121
122 * Release 1.6.0 (2010-02-01)
123
124 ** New Features
125
126 *** Immutable Directories
127
128 Tahoe-LAFS can now create and handle immutable directories. (#607, #833, #931)
129 These are read just like normal directories, but are "deep-immutable", meaning
130 that all their children (and everything reachable from those children) must be
131 immutable objects (i.e. immutable or literal files, and other immutable
132 directories).
133
134 These directories must be created in a single webapi call that provides all
135 of the children at once. (Since they cannot be changed after creation, the
136 usual create/add/add sequence cannot be used.) They have URIs that start with
137 "URI:DIR2-CHK:" or "URI:DIR2-LIT:", and are described on the human-facing web
138 interface (aka the "WUI") with a "DIR-IMM" abbreviation (as opposed to "DIR"
139 for the usual read-write directories and "DIR-RO" for read-only directories).
140
141 Tahoe-LAFS releases before 1.6.0 cannot read the contents of an immutable
142 directory. 1.5.0 will tolerate their presence in a directory listing (and
143 display it as "unknown"). 1.4.1 and earlier cannot tolerate them: a DIR-IMM
144 child in any directory will prevent the listing of that directory.
145
146 Immutable directories are repairable, just like normal immutable files.
147
148 The webapi "POST t=mkdir-immutable" call is used to create immutable
149 directories. See docs/frontends/webapi.txt for details.
150
151 *** "tahoe backup" now creates immutable directories, backupdb has dircache
152
153 The "tahoe backup" command has been enhanced to create immutable directories
154 (in previous releases, it created read-only mutable directories) (#828). This
155 is significantly faster, since it does not need to create an RSA keypair for
156 each new directory. Also "DIR-IMM" immutable directories are repairable, unlike
157 "DIR-RO" read-only mutable directories at present. (A future Tahoe-LAFS release
158 should also be able to repair DIR-RO.)
159
160 In addition, the backupdb (used by "tahoe backup" to remember what it has
161 already copied) has been enhanced to store information about existing immutable
162 directories. This allows it to re-use directories that have moved but still
163 contain identical contents, or that have been deleted and later replaced. (The
164 1.5.0 "tahoe backup" command could only re-use directories that were in the
165 same place as they were in the immediately previous backup.)  With this change,
166 the backup process no longer needs to read the previous snapshot out of the
167 Tahoe-LAFS grid, reducing the network load considerably. (#606)
168
169 A "null backup" (in which nothing has changed since the previous backup) will
170 require only two Tahoe-side operations: one to add an Archives/$TIMESTAMP
171 entry, and a second to update the Latest/ link. On the local disk side, it
172 will readdir() all your local directories and stat() all your local files.
173
174 If you've been using "tahoe backup" for a while, you will notice that your
175 first use of it after upgrading to 1.6.0 may take a long time: it must create
176 proper immutable versions of all the old read-only mutable directories. This
177 process won't take as long as the initial backup (where all the file contents
178 had to be uploaded too): it will require time proportional to the number and
179 size of your directories. After this initial pass, all subsequent passes
180 should take a tiny fraction of the time.
181
182 As noted above, Tahoe-LAFS versions earlier than 1.5.0 cannot list a directory
183 containing an immutable subdirectory. Tahoe-LAFS versions earlier than 1.6.0
184 cannot read the contents of an immutable directory.
185
186 The "tahoe backup" command has been improved to skip over unreadable objects
187 (like device files, named pipes, and files with permissions that prevent the
188 command from reading their contents), instead of throwing an exception and
189 terminating the backup process. It also skips over symlinks, because these
190 cannot be represented faithfully in the Tahoe-side filesystem. A warning
191 message will be emitted each time something is skipped. (#729, #850, #641)
192
193 *** "create-node" command added, "create-client" now implies --no-storage
194
195 The basic idea behind Tahoe-LAFS's client+server and client-only processes is
196 that you are creating a general-purpose Tahoe-LAFS "node" process, which has
197 several components that can be activated. Storage service is one of these
198 optional components, as is the Helper, FTP server, and SFTP server. Web gateway
199 functionality is nominally on this list, but it is always active; a future
200 release will make it optional. There are three special purpose servers that
201 can't currently be run as a component in a node: introducer, key-generator,
202 and stats-gatherer.
203
204 So now "tahoe create-node" will create a Tahoe-LAFS node process, and after
205 creation you can edit its tahoe.cfg to enable or disable the desired
206 services. It is a more general-purpose replacement for "tahoe create-client".
207 The default configuration has storage service enabled. For convenience, the
208 "--no-storage" argument makes a tahoe.cfg file that disables storage
209 service. (#760)
210
211 "tahoe create-client" has been changed to create a Tahoe-LAFS node without a
212 storage service. It is equivalent to "tahoe create-node --no-storage". This
213 helps to reduce the confusion surrounding the use of a command with "client" in
214 its name to create a storage *server*. Use "tahoe create-client" to create a
215 purely client-side node. If you want to offer storage to the grid, use
216 "tahoe create-node" instead.
217
218 In the future, other services will be added to the node, and they will be
219 controlled through options in tahoe.cfg . The most important of these
220 services may get additional --enable-XYZ or --disable-XYZ arguments to
221 "tahoe create-node".
222
223 ** Performance Improvements
224
225 Download of immutable files begins as soon as the downloader has located the K
226 necessary shares (#928, #287). In both the previous and current releases, a
227 downloader will first issue queries to all storage servers on the grid to
228 locate shares before it begins downloading the shares. In previous releases of
229 Tahoe-LAFS, download would not begin until all storage servers on the grid had
230 replied to the query, at which point K shares would be chosen for download from
231 among the shares that were located. In this release, download begins as soon as
232 any K shares are located. This means that downloads start sooner, which is
233 particularly important if there is a server on the grid that is extremely slow
234 or even hung in such a way that it will never respond. In previous releases
235 such a server would have a negative impact on all downloads from that grid. In
236 this release, such a server will have no impact on downloads, as long as K
237 shares can be found on other, quicker, servers.  This also means that
238 downloads now use the "best-alacrity" servers that they talk to, as measured by
239 how quickly the servers reply to the initial query. This might cause downloads
240 to go faster, especially on grids with heterogeneous servers or geographical
241 dispersion.
242
243 ** Minor Changes
244
245 The webapi acquired a new "t=mkdir-with-children" command, to create and
246 populate a directory in a single call. This is significantly faster than
247 using separate "t=mkdir" and "t=set-children" operations (it uses one
248 gateway-to-grid roundtrip, instead of three or four). (#533)
249
250 The t=set-children (note the hyphen) operation is now documented in
251 docs/frontends/webapi.txt, and is the new preferred spelling of the old
252 t=set_children (with an underscore). The underscore version remains for
253 backwards compatibility. (#381, #927)
254
255 The tracebacks produced by errors in CLI tools should now be in plain text,
256 instead of HTML (which is unreadable outside of a browser). (#646)
257
258 The [storage]reserved_space configuration knob (which causes the storage
259 server to refuse shares when available disk space drops below a threshold)
260 should work on Windows now, not just UNIX. (#637)
261
262 "tahoe cp" should now exit with status "1" if it cannot figure out a suitable
263 target filename, such as when you copy from a bare filecap. (#761)
264
265 "tahoe get" no longer creates a zero-length file upon error. (#121)
266
267 "tahoe ls" can now list single files. (#457)
268
269 "tahoe deep-check --repair" should tolerate repair failures now, instead of
270 halting traversal. (#874, #786)
271
272 "tahoe create-alias" no longer corrupts the aliases file if it had
273 previously been edited to have no trailing newline. (#741)
274
275 Many small packaging improvements were made to facilitate the "tahoe-lafs"
276 package being included in Ubuntu. Several mac/win32 binary libraries were
277 removed, some figleaf code-coverage files were removed, a bundled copy of
278 darcsver-1.2.1 was removed, and additional licensing text was added.
279
280 Several DeprecationWarnings for python2.6 were silenced. (#859)
281
282 The checker --add-lease option would sometimes fail for shares stored
283 on old (Tahoe v1.2.0) servers. (#875)
284
285 The documentation for installing on Windows (docs/install.html) has been
286 improved. (#773)
287
288 For other changes not mentioned here, see
289 <http://allmydata.org/trac/tahoe/query?milestone=1.6.0&keywords=!~news-done>.
290 To include the tickets mentioned above, go to
291 <http://allmydata.org/trac/tahoe/query?milestone=1.6.0>.
292
293
294 * Release 1.5.0 (2009-08-01)
295
296 ** Improvements
297
298 Uploads of immutable files now use pipelined writes, improving upload speed
299 slightly (10%) over high-latency connections. (#392)
300
301 Processing large directories has been sped up, by removing a O(N^2) algorithm
302 from the dirnode decoding path and retaining unmodified encrypted entries.
303 (#750, #752)
304
305 The human-facing web interface (aka the "WUI") received a significant CSS
306 makeover by Kevin Reid, making it much prettier and easier to read. The WUI
307 "check" and "deep-check" forms now include a "Renew Lease" checkbox,
308 mirroring the CLI --add-lease option, so leases can be added or renewed from
309 the web interface.
310
311 The CLI "tahoe mv" command now refuses to overwrite directories. (#705)
312
313 The CLI "tahoe webopen" command, when run without arguments, will now bring
314 up the "Welcome Page" (node status and mkdir/upload forms).
315
316 The 3.5MB limit on mutable files was removed, so it should be possible to
317 upload arbitrarily-sized mutable files. Note, however, that the data format
318 and algorithm remains the same, so using mutable files still requires
319 bandwidth, computation, and RAM in proportion to the size of the mutable file.
320 (#694)
321
322 This version of Tahoe-LAFS will tolerate directory entries that contain filecap
323 formats which it does not recognize: files and directories from the future.
324 This should improve the user experience (for 1.5.0 users) when we add new cap
325 formats in the future. Previous versions would fail badly, preventing the user
326 from seeing or editing anything else in those directories. These unrecognized
327 objects can be renamed and deleted, but obviously not read or written. Also
328 they cannot generally be copied. (#683)
329
330 ** Bugfixes
331
332 deep-check-and-repair now tolerates read-only directories, such as the ones
333 produced by the "tahoe backup" CLI command. Read-only directories and mutable
334 files are checked, but not repaired. Previous versions threw an exception
335 when attempting the repair and failed to process the remaining contents. We
336 cannot yet repair these read-only objects, but at least this version allows
337 the rest of the check+repair to proceed. (#625)
338
339 A bug in 1.4.1 which caused a server to be listed multiple times (and
340 frequently broke all connections to that server) was fixed. (#653)
341
342 The plaintext-hashing code was removed from the Helper interface, removing
343 the Helper's ability to mount a partial-information-guessing attack. (#722)
344
345 ** Platform/packaging changes
346
347 Tahoe-LAFS now runs on NetBSD, OpenBSD, ArchLinux, and NixOS, and on an
348 embedded system based on an ARM CPU running at 266 MHz.
349
350 Unit test timeouts have been raised to allow the tests to complete on
351 extremely slow platforms like embedded ARM-based NAS boxes, which may take
352 several hours to run the test suite. An ARM-specific data-corrupting bug in
353 an older version of Crypto++ (5.5.2) was identified: ARM-users are encouraged
354 to use recent Crypto++/pycryptopp which avoids this problem.
355
356 Tahoe-LAFS now requires a SQLite library, either the sqlite3 that comes
357 built-in with python2.5/2.6, or the add-on pysqlite2 if you're using
358 python2.4. In the previous release, this was only needed for the "tahoe backup"
359 command: now it is mandatory.
360
361 Several minor documentation updates were made.
362
363 To help get Tahoe-LAFS into Linux distributions like Fedora and Debian,
364 packaging improvements are being made in both Tahoe-LAFS and related libraries
365 like pycryptopp and zfec.
366
367 The Crypto++ library included in the pycryptopp package has been upgraded to
368 version 5.6.0 of Crypto++, which includes a more efficient implementation of
369 SHA-256 in assembly for x86 or amd64 architectures.
370
371 ** dependency updates
372
373  foolscap-0.4.1
374  no python-2.4.0 or 2.4.1 (2.4.2 is good)
375   (they contained a bug in base64.b32decode)
376  avoid python-2.6 on windows with mingw: compiler issues
377  python2.4 requires pysqlite2 (2.5,2.6 does not)
378  no python-3.x
379  pycryptopp-0.5.15
380
381
382 * Release 1.4.1 (2009-04-13)
383
384 ** Garbage Collection
385
386 The big feature for this release is the implementation of garbage collection,
387 allowing Tahoe storage servers to delete shares for old deleted files. When
388 enabled, this uses a "mark and sweep" process: clients are responsible for
389 updating the leases on their shares (generally by running "tahoe deep-check
390 --add-lease"), and servers are allowed to delete any share which does not
391 have an up-to-date lease. The process is described in detail in
392 docs/garbage-collection.txt .
393
394 The server must be configured to enable garbage-collection, by adding
395 directives to the [storage] section that define an age limit for shares. The
396 default configuration will not delete any shares.
397
398 Both servers and clients should be upgraded to this release to make the
399 garbage-collection as pleasant as possible. 1.2.0 servers have code to
400 perform the update-lease operation but it suffers from a fatal bug, while
401 1.3.0 servers have update-lease but will return an exception for unknown
402 storage indices, causing clients to emit an Incident for each exception,
403 slowing the add-lease process down to a crawl. 1.1.0 servers did not have the
404 add-lease operation at all.
405
406 ** Security/Usability Problems Fixed
407
408 A super-linear algorithm in the Merkle Tree code was fixed, which previously
409 caused e.g. download of a 10GB file to take several hours before the first
410 byte of plaintext could be produced. The new "alacrity" is about 2 minutes. A
411 future release should reduce this to a few seconds by fixing ticket #442.
412
413 The previous version permitted a small timing attack (due to our use of
414 strcmp) against the write-enabler and lease-renewal/cancel secrets. An
415 attacker who could measure response-time variations of approximatly 3ns
416 against a very noisy background time of about 15ms might be able to guess
417 these secrets. We do not believe this attack was actually feasible. This
418 release closes the attack by first hashing the two strings to be compared
419 with a random secret.
420
421 ** webapi changes
422
423 In most cases, HTML tracebacks will only be sent if an "Accept: text/html"
424 header was provided with the HTTP request. This will generally cause browsers
425 to get an HTMLized traceback but send regular text/plain tracebacks to
426 non-browsers (like the CLI clients). More errors have been mapped to useful
427 HTTP error codes.
428
429 The streaming webapi operations (deep-check and manifest) now have a way to
430 indicate errors (an output line that starts with "ERROR" instead of being
431 legal JSON). See docs/frontends/webapi.txt for details.
432
433 The storage server now has its own status page (at /storage), linked from the
434 Welcome page. This page shows progress and results of the two new
435 share-crawlers: one which merely counts shares (to give an estimate of how
436 many files/directories are being stored in the grid), the other examines
437 leases and reports how much space would be freed if GC were enabled. The page
438 also shows how much disk space is present, used, reserved, and available for
439 the Tahoe server, and whether the server is currently running in "read-write"
440 mode or "read-only" mode.
441
442 When a directory node cannot be read (perhaps because of insufficent shares),
443 a minimal webapi page is created so that the "more-info" links (including a
444 Check/Repair operation) will still be accessible.
445
446 A new "reliability" page was added, with the beginnings of work on a
447 statistical loss model. You can tell this page how many servers you are using
448 and their independent failure probabilities, and it will tell you the
449 likelihood that an arbitrary file will survive each repair period. The
450 "numpy" package must be installed to access this page. A partial paper,
451 written by Shawn Willden, has been added to docs/proposed/lossmodel.lyx .
452
453 ** CLI changes
454
455 "tahoe check" and "tahoe deep-check" now accept an "--add-lease" argument, to
456 update a lease on all shares. This is the "mark" side of garbage collection.
457
458 In many cases, CLI error messages have been improved: the ugly HTMLized
459 traceback has been replaced by a normal python traceback.
460
461 "tahoe deep-check" and "tahoe manifest" now have better error reporting.
462 "tahoe cp" is now non-verbose by default.
463
464 "tahoe backup" now accepts several "--exclude" arguments, to ignore certain
465 files (like editor temporary files and version-control metadata) during
466 backup.
467
468 On windows, the CLI now accepts local paths like "c:\dir\file.txt", which
469 previously was interpreted as a Tahoe path using a "c:" alias.
470
471 The "tahoe restart" command now uses "--force" by default (meaning it will
472 start a node even if it didn't look like there was one already running).
473
474 The "tahoe debug consolidate" command was added. This takes a series of
475 independent timestamped snapshot directories (such as those created by the
476 allmydata.com windows backup program, or a series of "tahoe cp -r" commands)
477 and creates new snapshots that used shared read-only directories whenever
478 possible (like the output of "tahoe backup"). In the most common case (when
479 the snapshots are fairly similar), the result will use significantly fewer
480 directories than the original, allowing "deep-check" and similar tools to run
481 much faster. In some cases, the speedup can be an order of magnitude or more.
482 This tool is still somewhat experimental, and only needs to be run on large
483 backups produced by something other than "tahoe backup", so it was placed
484 under the "debug" category.
485
486 "tahoe cp -r --caps-only tahoe:dir localdir" is a diagnostic tool which,
487 instead of copying the full contents of files into the local directory,
488 merely copies their filecaps. This can be used to verify the results of a
489 "consolidation" operation.
490
491 ** other fixes
492
493 The codebase no longer rauses RuntimeError as a kind of assert(). Specific
494 exception classes were created for each previous instance of RuntimeError.
495
496 Many unit tests were changed to use a non-network test harness, speeding them
497 up considerably.
498
499 Deep-traversal operations (manifest and deep-check) now walk individual
500 directories in alphabetical order. Occasional turn breaks are inserted to
501 prevent a stack overflow when traversing directories with hundreds of
502 entries.
503
504 The experimental SFTP server had its path-handling logic changed slightly, to
505 accomodate more SFTP clients, although there are still issues (#645).
506
507
508 * Release 1.3.0 (2009-02-13)
509
510 ** Checker/Verifier/Repairer
511
512 The primary focus of this release has been writing a checker / verifier /
513 repairer for files and directories.  "Checking" is the act of asking storage
514 servers whether they have a share for the given file or directory: if there
515 are not enough shares available, the file or directory will be
516 unrecoverable. "Verifying" is the act of downloading and cryptographically
517 asserting that the server's share is undamaged: it requires more work
518 (bandwidth and CPU) than checking, but can catch problems that simple
519 checking cannot. "Repair" is the act of replacing missing or damaged shares
520 with new ones.
521
522 This release includes a full checker, a partial verifier, and a partial
523 repairer. The repairer is able to handle missing shares: new shares are
524 generated and uploaded to make up for the missing ones. This is currently the
525 best application of the repairer: to replace shares that were lost because of
526 server departure or permanent drive failure.
527
528 The repairer in this release is somewhat able to handle corrupted shares. The
529 limitations are:
530
531  * Immutable verifier is incomplete: not all shares are used, and not all
532    fields of those shares are verified. Therefore the immutable verifier has
533    only a moderate chance of detecting corrupted shares.
534  * The mutable verifier is mostly complete: all shares are examined, and most
535    fields of the shares are validated.
536  * The storage server protocol offers no way for the repairer to replace or
537    delete immutable shares. If corruption is detected, the repairer will
538    upload replacement shares to other servers, but the corrupted shares will
539    be left in place.
540  * read-only directories and read-only mutable files must be repaired by
541    someone who holds the write-cap: the read-cap is insufficient. Moreover,
542    the deep-check-and-repair operation will halt with an error if it attempts
543    to repair one of these read-only objects.
544  * Some forms of corruption can cause both download and repair operations to
545    fail. A future release will fix this, since download should be tolerant of
546    any corruption as long as there are at least 'k' valid shares, and repair
547    should be able to fix any file that is downloadable.
548
549 If the downloader, verifier, or repairer detects share corruption, the
550 servers which provided the bad shares will be notified (via a file placed in
551 the BASEDIR/storage/corruption-advisories directory) so their operators can
552 manually delete the corrupted shares and investigate the problem. In
553 addition, the "incident gatherer" mechanism will automatically report share
554 corruption to an incident gatherer service, if one is configured. Note that
555 corrupted shares indicate hardware failures, serious software bugs, or malice
556 on the part of the storage server operator, so a corrupted share should be
557 considered highly unusual.
558
559 By periodically checking/repairing all files and directories, objects in the
560 Tahoe filesystem remain resistant to recoverability failures due to missing
561 and/or broken servers.
562
563 This release includes a wapi mechanism to initiate checks on individual
564 files and directories (with or without verification, and with or without
565 automatic repair). A related mechanism is used to initiate a "deep-check" on
566 a directory: recursively traversing the directory and its children, checking
567 (and/or verifying/repairing) everything underneath. Both mechanisms can be
568 run with an "output=JSON" argument, to obtain machine-readable check/repair
569 status results. These results include a copy of the filesystem statistics
570 from the "deep-stats" operation (including total number of files, size
571 histogram, etc). If repair is possible, a "Repair" button will appear on the
572 results page.
573
574 The client web interface now features some extra buttons to initiate check
575 and deep-check operations. When these operations finish, they display a
576 results page that summarizes any problems that were encountered. All
577 long-running deep-traversal operations, including deep-check, use a
578 start-and-poll mechanism, to avoid depending upon a single long-lived HTTP
579 connection. docs/frontends/webapi.txt has details.
580
581 ** Efficient Backup
582
583 The "tahoe backup" command is new in this release, which creates efficient
584 versioned backups of a local directory. Given a local pathname and a target
585 Tahoe directory, this will create a read-only snapshot of the local directory
586 in $target/Archives/$timestamp. It will also create $target/Latest, which is
587 a reference to the latest such snapshot. Each time you run "tahoe backup"
588 with the same source and target, a new $timestamp snapshot will be added.
589 These snapshots will share directories that have not changed since the last
590 backup, to speed up the process and minimize storage requirements. In
591 addition, a small database is used to keep track of which local files have
592 been uploaded already, to avoid uploading them a second time. This
593 drastically reduces the work needed to do a "null backup" (when nothing has
594 changed locally), making "tahoe backup' suitable to run from a daily cronjob.
595
596 Note that the "tahoe backup" CLI command must be used in conjunction with a
597 1.3.0-or-newer Tahoe client node; there was a bug in the 1.2.0 webapi
598 implementation that would prevent the last step (create $target/Latest) from
599 working.
600
601 ** Large Files
602
603 The 12GiB (approximate) immutable-file-size limitation is lifted. This
604 release knows how to handle so-called "v2 immutable shares", which permit
605 immutable files of up to about 18 EiB (about 3*10^14). These v2 shares are
606 created if the file to be uploaded is too large to fit into v1 shares. v1
607 shares are created if the file is small enough to fit into them, so that
608 files created with tahoe-1.3.0 can still be read by earlier versions if they
609 are not too large. Note that storage servers also had to be changed to
610 support larger files, and this release is the first release in which they are
611 able to do that. Clients will detect which servers are capable of supporting
612 large files on upload and will not attempt to upload shares of a large file
613 to a server which doesn't support it.
614
615 ** FTP/SFTP Server
616
617 Tahoe now includes experimental FTP and SFTP servers. When configured with a
618 suitable method to translate username+password into a root directory cap, it
619 provides simple access to the virtual filesystem. Remember that FTP is
620 completely unencrypted: passwords, filenames, and file contents are all sent
621 over the wire in cleartext, so FTP should only be used on a local (127.0.0.1)
622 connection. This feature is still in development: there are no unit tests
623 yet, and behavior with respect to Unicode filenames is uncertain. Please see
624 docs/frontends/FTP-and-SFTP.txt for configuration details. (#512, #531)
625
626 ** CLI Changes
627
628 This release adds the 'tahoe create-alias' command, which is a combination of
629 'tahoe mkdir' and 'tahoe add-alias'. This also allows you to start using a
630 new tahoe directory without exposing its URI in the argv list, which is
631 publicly visible (through the process table) on most unix systems.  Thanks to
632 Kevin Reid for bringing this issue to our attention.
633
634 The single-argument form of "tahoe put" was changed to create an unlinked
635 file. I.e. "tahoe put bar.txt" will take the contents of a local "bar.txt"
636 file, upload them to the grid, and print the resulting read-cap; the file
637 will not be attached to any directories. This seemed a bit more useful than
638 the previous behavior (copy stdin, upload to the grid, attach the resulting
639 file into your default tahoe: alias in a child named 'bar.txt').
640
641 "tahoe put" was also fixed to handle mutable files correctly: "tahoe put
642 bar.txt URI:SSK:..." will read the contents of the local bar.txt and use them
643 to replace the contents of the given mutable file.
644
645 The "tahoe webopen" command was modified to accept aliases. This means "tahoe
646 webopen tahoe:" will cause your web browser to open to a "wui" page that
647 gives access to the directory associated with the default "tahoe:" alias. It
648 should also accept leading slashes, like "tahoe webopen tahoe:/stuff".
649
650 Many esoteric debugging commands were moved down into a "debug" subcommand:
651
652  tahoe debug dump-cap
653  tahoe debug dump-share
654  tahoe debug find-shares
655  tahoe debug catalog-shares
656  tahoe debug corrupt-share
657
658 The last command ("tahoe debug corrupt-share") flips a random bit of the
659 given local sharefile. This is used to test the file verifying/repairing
660 code, and obviously should not be used on user data.
661
662 The cli might not correctly handle arguments which contain non-ascii
663 characters in Tahoe v1.3 (although depending on your platform it
664 might, especially if your platform can be configured to pass such
665 characters on the command-line in utf-8 encoding).  See
666 http://allmydata.org/trac/tahoe/ticket/565 for details.
667
668 ** Web changes
669
670 The "default webapi port", used when creating a new client node (and in the
671 getting-started documentation), was changed from 8123 to 3456, to reduce
672 confusion when Tahoe accessed through a Firefox browser on which the
673 "Torbutton" extension has been installed. Port 8123 is occasionally used as a
674 Tor control port, so Torbutton adds 8123 to Firefox's list of "banned ports"
675 to avoid CSRF attacks against Tor. Once 8123 is banned, it is difficult to
676 diagnose why you can no longer reach a Tahoe node, so the Tahoe default was
677 changed. Note that 3456 is reserved by IANA for the "vat" protocol, but there
678 are argueably more Torbutton+Tahoe users than vat users these days. Note that
679 this will only affect newly-created client nodes. Pre-existing client nodes,
680 created by earlier versions of tahoe, may still be listening on 8123.
681
682 All deep-traversal operations (start-manifest, start-deep-size,
683 start-deep-stats, start-deep-check) now use a start-and-poll approach,
684 instead of using a single (fragile) long-running synchronous HTTP connection.
685 All these "start-" operations use POST instead of GET. The old "GET
686 manifest", "GET deep-size", and "POST deep-check" operations have been
687 removed.
688
689 The new "POST start-manifest" operation, when it finally completes, results
690 in a table of (path,cap), instead of the list of verifycaps produced by the
691 old "GET manifest". The table is available in several formats: use
692 output=html, output=text, or output=json to choose one. The JSON output also
693 includes stats, and a list of verifycaps and storage-index strings.
694
695 The "return_to=" and "when_done=" arguments have been removed from the
696 t=check and deep-check operations.
697
698 The top-level status page (/status) now has a machine-readable form, via
699 "/status/?t=json". This includes information about the currently-active
700 uploads and downloads, which may be useful for frontends that wish to display
701 progress information. There is no easy way to correlate the activities
702 displayed here with recent wapi requests, however.
703
704 Any files in BASEDIR/public_html/ (configurable) will be served in response
705 to requests in the /static/ portion of the URL space. This will simplify the
706 deployment of javascript-based frontends that can still access wapi calls
707 by conforming to the (regrettable) "same-origin policy".
708
709 The welcome page now has a "Report Incident" button, which is tied into the
710 "Incident Gatherer" machinery. If the node is attached to an incident
711 gatherer (via log_gatherer.furl), then pushing this button will cause an
712 Incident to be signalled: this means recent log events are aggregated and
713 sent in a bundle to the gatherer. The user can push this button after
714 something strange takes place (and they can provide a short message to go
715 along with it), and the relevant data will be delivered to a centralized
716 incident-gatherer for later processing by operations staff.
717
718 The "HEAD" method should now work correctly, in addition to the usual "GET",
719 "PUT", and "POST" methods. "HEAD" is supposed to return exactly the same
720 headers as "GET" would, but without any of the actual response body data. For
721 mutable files, this now does a brief mapupdate (to figure out the size of the
722 file that would be returned), without actually retrieving the file's
723 contents.
724
725 The "GET" operation on files can now support the HTTP "Range:" header,
726 allowing requests for partial content. This allows certain media players to
727 correctly stream audio and movies out of a Tahoe grid. The current
728 implementation uses a disk-based cache in BASEDIR/private/cache/download ,
729 which holds the plaintext of the files being downloaded. Future
730 implementations might not use this cache. GET for immutable files now returns
731 an ETag header.
732
733 Each file and directory now has a "Show More Info" web page, which contains
734 much of the information that was crammed into the directory page before. This
735 includes readonly URIs, storage index strings, object type, buttons to
736 control checking/verifying/repairing, and deep-check/deep-stats buttons (for
737 directories). For mutable files, the "replace contents" upload form has been
738 moved here too. As a result, the directory page is now much simpler and
739 cleaner, and several potentially-misleading links (like t=uri) are now gone.
740
741 Slashes are discouraged in Tahoe file/directory names, since they cause
742 problems when accessing the filesystem through the wapi. However, there are
743 a couple of accidental ways to generate such names. This release tries to
744 make it easier to correct such mistakes by escaping slashes in several
745 places, allowing slashes in the t=info and t=delete commands, and in the
746 source (but not the target) of a t=rename command.
747
748 ** Packaging
749
750 Tahoe's dependencies have been extended to require the "[secure_connections]"
751 feature from Foolscap, which will cause pyOpenSSL to be required and/or
752 installed. If OpenSSL and its development headers are already installed on
753 your system, this can occur automatically. Tahoe now uses pollreactor
754 (instead of the default selectreactor) to work around a bug between pyOpenSSL
755 and the most recent release of Twisted (8.1.0). This bug only affects unit
756 tests (hang during shutdown), and should not impact regular use.
757
758 The Tahoe source code tarballs now come in two different forms: regular and
759 "sumo". The regular tarball contains just Tahoe, nothing else. When building
760 from the regular tarball, the build process will download any unmet
761 dependencies from the internet (starting with the index at PyPI) so it can
762 build and install them. The "sumo" tarball contains copies of all the
763 libraries that Tahoe requires (foolscap, twisted, zfec, etc), so using the
764 "sumo" tarball should not require any internet access during the build
765 process. This can be useful if you want to build Tahoe while on an airplane,
766 a desert island, or other bandwidth-limited environments.
767
768 Similarly, allmydata.org now hosts a "tahoe-deps" tarball which contains the
769 latest versions of all these dependencies. This tarball, located at
770 http://allmydata.org/source/tahoe/deps/tahoe-deps.tar.gz, can be unpacked in
771 the tahoe source tree (or in its parent directory), and the build process
772 should satisfy its downloading needs from it instead of reaching out to PyPI.
773 This can be useful if you want to build Tahoe from a darcs checkout while on
774 that airplane or desert island.
775
776 Because of the previous two changes ("sumo" tarballs and the "tahoe-deps"
777 bundle), most of the files have been removed from misc/dependencies/ . This
778 brings the regular Tahoe tarball down to 2MB (compressed), and the darcs
779 checkout (without history) to about 7.6MB. A full darcs checkout will still
780 be fairly large (because of the historical patches which included the
781 dependent libraries), but a 'lazy' one should now be small.
782
783 The default "make" target is now an alias for "setup.py build", which itself
784 is an alias for "setup.py develop --prefix support", with some extra work
785 before and after (see setup.cfg). Most of the complicated platform-dependent
786 code in the Makefile was rewritten in Python and moved into setup.py,
787 simplifying things considerably.
788
789 Likewise, the "make test" target now delegates most of its work to "setup.py
790 test", which takes care of getting PYTHONPATH configured to access the tahoe
791 code (and dependencies) that gets put in support/lib/ by the build_tahoe
792 step. This should allow unit tests to be run even when trial (which is part
793 of Twisted) wasn't already installed (in this case, trial gets installed to
794 support/bin because Twisted is a dependency of Tahoe).
795
796 Tahoe is now compatible with the recently-released Python 2.6 , although it
797 is recommended to use Tahoe on Python 2.5, on which it has received more
798 thorough testing and deployment.
799
800 Tahoe is now compatible with simplejson-2.0.x . The previous release assumed
801 that simplejson.loads always returned unicode strings, which is no longer the
802 case in 2.0.x .
803
804 ** Grid Management Tools
805
806 Several tools have been added or updated in the misc/ directory, mostly munin
807 plugins that can be used to monitor a storage grid.
808
809 The misc/spacetime/ directory contains a "disk watcher" daemon (startable
810 with 'tahoe start'), which can be configured with a set of HTTP URLs
811 (pointing at the wapi '/statistics' page of a bunch of storage servers),
812 and will periodically fetch disk-used/disk-available information from all the
813 servers. It keeps this information in an Axiom database (a sqlite-based
814 library available from divmod.org). The daemon computes time-averaged rates
815 of disk usage, as well as a prediction of how much time is left before the
816 grid is completely full.
817
818 The misc/munin/ directory contains a new set of munin plugins
819 (tahoe_diskleft, tahoe_diskusage, tahoe_doomsday) which talk to the
820 disk-watcher and provide graphs of its calculations.
821
822 To support the disk-watcher, the Tahoe statistics component (visible through
823 the wapi at the /statistics/ URL) now includes disk-used and disk-available
824 information. Both are derived through an equivalent of the unix 'df' command
825 (i.e. they ask the kernel for the number of free blocks on the partition that
826 encloses the BASEDIR/storage directory). In the future, the disk-available
827 number will be further influenced by the local storage policy: if that policy
828 says that the server should refuse new shares when less than 5GB is left on
829 the partition, then "disk-available" will report zero even though the kernel
830 sees 5GB remaining.
831
832 The 'tahoe_overhead' munin plugin interacts with an allmydata.com-specific
833 server which reports the total of the 'deep-size' reports for all active user
834 accounts, compares this with the disk-watcher data, to report on overhead
835 percentages. This provides information on how much space could be recovered
836 once Tahoe implements some form of garbage collection.
837
838 ** Configuration Changes: single INI-format tahoe.cfg file
839
840 The Tahoe node is now configured with a single INI-format file, named
841 "tahoe.cfg", in the node's base directory. Most of the previous
842 multiple-separate-files are still read for backwards compatibility (the
843 embedded SSH debug server and the advertised_ip_addresses files are the
844 exceptions), but new directives will only be added to tahoe.cfg . The "tahoe
845 create-client" command will create a tahoe.cfg for you, with sample values
846 commented out. (ticket #518)
847
848 tahoe.cfg now has controls for the foolscap "keepalive" and "disconnect"
849 timeouts (#521).
850
851 tahoe.cfg now has controls for the encoding parameters: "shares.needed" and
852 "shares.total" in the "[client]" section. The default parameters are still
853 3-of-10.
854
855 The inefficient storage 'sizelimit' control (which established an upper bound
856 on the amount of space that a storage server is allowed to consume) has been
857 replaced by a lightweight 'reserved_space' control (which establishes a lower
858 bound on the amount of remaining space). The storage server will reject all
859 writes that would cause the remaining disk space (as measured by a '/bin/df'
860 equivalent) to drop below this value. The "[storage]reserved_space="
861 tahoe.cfg parameter controls this setting. (note that this only affects
862 immutable shares: it is an outstanding bug that reserved_space does not
863 prevent the allocation of new mutable shares, nor does it prevent the growth
864 of existing mutable shares).
865
866 ** Other Changes
867
868 Clients now declare which versions of the protocols they support. This is
869 part of a new backwards-compatibility system:
870 http://allmydata.org/trac/tahoe/wiki/Versioning .
871
872 The version strings for human inspection (as displayed on the Welcome web
873 page, and included in logs) now includes a platform identifer (frequently
874 including a linux distribution name, processor architecture, etc).
875
876 Several bugs have been fixed, including one that would cause an exception (in
877 the logs) if a wapi download operation was cancelled (by closing the TCP
878 connection, or pushing the "stop" button in a web browser).
879
880 Tahoe now uses Foolscap "Incidents", writing an "incident report" file to
881 logs/incidents/ each time something weird occurs. These reports are available
882 to an "incident gatherer" through the flogtool command. For more details,
883 please see the Foolscap logging documentation. An incident-classifying plugin
884 function is provided in misc/incident-gatherer/classify_tahoe.py .
885
886 If clients detect corruption in shares, they now automatically report it to
887 the server holding that share, if it is new enough to accept the report.
888 These reports are written to files in BASEDIR/storage/corruption-advisories .
889
890 The 'nickname' setting is now defined to be a UTF-8 -encoded string, allowing
891 non-ascii nicknames.
892
893 The 'tahoe start' command will now accept a --syslog argument and pass it
894 through to twistd, making it easier to launch non-Tahoe nodes (like the
895 cpu-watcher) and have them log to syslogd instead of a local file. This is
896 useful when running a Tahoe node out of a USB flash drive.
897
898 The Mac GUI in src/allmydata/gui/ has been improved.
899
900
901 * Release 1.2.0 (2008-07-21)
902
903 ** Security
904
905 This release makes the immutable-file "ciphertext hash tree" mandatory.
906 Previous releases allowed the uploader to decide whether their file would
907 have an integrity check on the ciphertext or not. A malicious uploader could
908 use this to create a readcap that would download as one file or a different
909 one, depending upon which shares the client fetched first, with no errors
910 raised. There are other integrity checks on the shares themselves, preventing
911 a storage server or other party from violating the integrity properties of
912 the read-cap: this failure was only exploitable by the uploader who gives you
913 a carefully constructed read-cap. If you download the file with Tahoe 1.2.0
914 or later, you will not be vulnerable to this problem. #491
915
916 This change does not introduce a compatibility issue, because all existing
917 versions of Tahoe will emit the ciphertext hash tree in their shares.
918
919 ** Dependencies
920
921 Tahoe now requires Foolscap-0.2.9 . It also requires pycryptopp 0.5 or newer,
922 since earlier versions had a bug that interacted with specific compiler
923 versions that could sometimes result in incorrect encryption behavior. Both
924 packages are included in the Tahoe source tarball in misc/dependencies/ , and
925 should be built automatically when necessary.
926
927 ** Web API
928
929 Web API directory pages should now contain properly-slash-terminated links to
930 other directories. They have also stopped using absolute links in forms and
931 pages (which interfered with the use of a front-end load-balancing proxy).
932
933 The behavior of the "Check This File" button changed, in conjunction with
934 larger internal changes to file checking/verification. The button triggers an
935 immediate check as before, but the outcome is shown on its own page, and does
936 not get stored anywhere. As a result, the web directory page no longer shows
937 historical checker results.
938
939 A new "Deep-Check" button has been added, which allows a user to initiate a
940 recursive check of the given directory and all files and directories
941 reachable from it. This can cause quite a bit of work, and has no
942 intermediate progress information or feedback about the process. In addition,
943 the results of the deep-check are extremely limited. A later release will
944 improve this behavior.
945
946 The web server's behavior with respect to non-ASCII (unicode) filenames in
947 the "GET save=true" operation has been improved. To achieve maximum
948 compatibility with variously buggy web browsers, the server does not try to
949 figure out the character set of the inbound filename. It just echoes the same
950 bytes back to the browser in the Content-Disposition header. This seems to
951 make both IE7 and Firefox work correctly.
952
953 ** Checker/Verifier/Repairer
954
955 Tahoe is slowly acquiring convenient tools to check up on file health,
956 examine existing shares for errors, and repair files that are not fully
957 healthy. This release adds a mutable checker/verifier/repairer, although
958 testing is very limited, and there are no web interfaces to trigger repair
959 yet. The "Check" button next to each file or directory on the wapi page
960 will perform a file check, and the "deep check" button on each directory will
961 recursively check all files and directories reachable from there (which may
962 take a very long time).
963
964 Future releases will improve access to this functionality.
965
966 ** Operations/Packaging
967
968 A "check-grid" script has been added, along with a Makefile target. This is
969 intended (with the help of a pre-configured node directory) to check upon the
970 health of a Tahoe grid, uploading and downloading a few files. This can be
971 used as a monitoring tool for a deployed grid, to be run periodically and to
972 signal an error if it ever fails. It also helps with compatibility testing,
973 to verify that the latest Tahoe code is still able to handle files created by
974 an older version.
975
976 The munin plugins from misc/munin/ are now copied into any generated debian
977 packages, and are made executable (and uncompressed) so they can be symlinked
978 directly from /etc/munin/plugins/ .
979
980 Ubuntu "Hardy" was added as a supported debian platform, with a Makefile
981 target to produce hardy .deb packages. Some notes have been added to
982 docs/debian.txt about building Tahoe on a debian/ubuntu system.
983
984 Storage servers now measure operation rates and latency-per-operation, and
985 provides results through the /statistics web page as well as the stats
986 gatherer. Munin plugins have been added to match.
987
988 ** Other
989
990 Tahoe nodes now use Foolscap "incident logging" to record unusual events to
991 their NODEDIR/logs/incidents/ directory. These incident files can be examined
992 by Foolscap logging tools, or delivered to an external log-gatherer for
993 further analysis. Note that Tahoe now requires Foolscap-0.2.9, since 0.2.8
994 had a bug that complained about "OSError: File exists" when trying to create
995 the incidents/ directory for a second time.
996
997 If no servers are available when retrieving a mutable file (like a
998 directory), the node now reports an error instead of hanging forever. Earlier
999 releases would not only hang (causing the wapi directory listing to get
1000 stuck half-way through), but the internal dirnode serialization would cause
1001 all subsequent attempts to retrieve or modify the same directory to hang as
1002 well. #463
1003
1004 A minor internal exception (reported in logs/twistd.log, in the
1005 "stopProducing" method) was fixed, which complained about "self._paused_at
1006 not defined" whenever a file download was stopped from the web browser end.
1007
1008
1009 * Release 1.1.0 (2008-06-11)
1010
1011 ** CLI: new "alias" model
1012
1013 The new CLI code uses an scp/rsync -like interface, in which directories in
1014 the Tahoe storage grid are referenced by a colon-suffixed alias. The new
1015 commands look like:
1016  tahoe cp local.txt tahoe:virtual.txt
1017  tahoe ls work:subdir
1018
1019 More functionality is available through the CLI: creating unlinked files and
1020 directories, recursive copy in or out of the storage grid, hardlinks, and
1021 retrieving the raw read- or write- caps through the 'ls' command. Please read
1022 docs/CLI.txt for complete details.
1023
1024 ** wapi: new pages, new commands
1025
1026 Several new pages were added to the web API:
1027
1028  /helper_status : to describe what a Helper is doing
1029  /statistics : reports node uptime, CPU usage, other stats
1030  /file : for easy file-download URLs, see #221
1031  /cap == /uri : future compatibility
1032
1033 The localdir=/localfile= and t=download operations were removed. These
1034 required special configuration to enable anyways, but this feature was a
1035 security problem, and was mostly obviated by the new "cp -r" command.
1036
1037 Several new options to the GET command were added:
1038
1039  t=deep-size : add up the size of all immutable files reachable from the directory
1040  t=deep-stats : return a JSON-encoded description of number of files, size
1041                 distribution, total size, etc
1042
1043 POST is now preferred over PUT for most operations which cause side-effects.
1044
1045 Most wapi calls now accept overwrite=, and default to overwrite=true .
1046
1047 "POST /uri/DIRCAP/parent/child?t=mkdir" is now the preferred API to create
1048 multiple directories at once, rather than ...?t=mkdir-p .
1049
1050 PUT to a mutable file ("PUT /uri/MUTABLEFILECAP", "PUT /uri/DIRCAP/child")
1051 will modify the file in-place.
1052
1053 ** more munin graphs in misc/munin/
1054
1055   tahoe-introstats
1056   tahoe-rootdir-space
1057   tahoe_estimate_files
1058   mutable files published/retrieved
1059   tahoe_cpu_watcher
1060   tahoe_spacetime
1061
1062 ** New Dependencies
1063
1064   zfec 1.1.0
1065   foolscap 0.2.8
1066   pycryptopp 0.5
1067   setuptools (now required at runtime)
1068
1069 ** New Mutable-File Code
1070
1071 The mutable-file handling code (mostly used for directories) has been
1072 completely rewritten. The new scheme has a better API (with a modify()
1073 method) and is less likely to lose data when several uncoordinated writers
1074 change a file at the same time.
1075
1076 In addition, a single Tahoe process will coordinate its own writes. If you
1077 make two concurrent directory-modifying wapi calls to a single tahoe node,
1078 it will internally make one of them wait for the other to complete. This
1079 prevents auto-collision (#391).
1080
1081 The new mutable-file code also detects errors during publish better. Earlier
1082 releases might believe that a mutable file was published when in fact it
1083 failed.
1084
1085 ** other features
1086
1087 The node now monitors its own CPU usage, as a percentage, measured every 60
1088 seconds. 1/5/15 minute moving averages are available on the /statistics web
1089 page and via the stats-gathering interface.
1090
1091 Clients now accelerate reconnection to all servers after being offline
1092 (#374). When a client is offline for a long time, it scales back reconnection
1093 attempts to approximately once per hour, so it may take a while to make the
1094 first attempt, but once any attempt succeeds, the other server connections
1095 will be retried immediately.
1096
1097 A new "offloaded KeyGenerator" facility can be configured, to move RSA key
1098 generation out from, say, a wapi node, into a separate process. RSA keys
1099 can take several seconds to create, and so a wapi node which is being used
1100 for directory creation will be unavailable for anything else during this
1101 time. The Key Generator process will pre-compute a small pool of keys, to
1102 speed things up further. This also takes better advantage of multi-core CPUs,
1103 or SMP hosts.
1104
1105 The node will only use a potentially-slow "du -s" command at startup (to
1106 measure how much space has been used) if the "sizelimit" parameter has been
1107 configured (to limit how much space is used). Large storage servers should
1108 turn off sizelimit until a later release improves the space-management code,
1109 since "du -s" on a terabyte filesystem can take hours.
1110
1111 The Introducer now allows new announcements to replace old ones, to avoid
1112 buildups of obsolete announcements.
1113
1114 Immutable files are limited to about 12GiB (when using the default 3-of-10
1115 encoding), because larger files would be corrupted by the four-byte
1116 share-size field on the storage servers (#439). A later release will remove
1117 this limit. Earlier releases would allow >12GiB uploads, but the resulting
1118 file would be unretrievable.
1119
1120 The docs/ directory has been rearranged, with old docs put in
1121 docs/historical/ and not-yet-implemented ones in docs/proposed/ .
1122
1123 The Mac OS-X FUSE plugin has a significant bug fix: earlier versions would
1124 corrupt writes that used seek() instead of writing the file in linear order.
1125 The rsync tool is known to perform writes in this order. This has been fixed.