logo资料库

Weka操作手册.pdf

第1页 / 共327页
第2页 / 共327页
第3页 / 共327页
第4页 / 共327页
第5页 / 共327页
第6页 / 共327页
第7页 / 共327页
第8页 / 共327页
资料共327页,剩余部分请下载后查看
I The Command-line
A command-line primer
Introduction
Basic concepts
Dataset
Classifier
weka.filters
weka.classifiers
Examples
Additional packages and the package manager
Package management
Running installed learning algorithms
II The Graphical User Interface
Launching WEKA
Package Manager
Main window
Installing and removing packages
Using a http proxy
Using an alternative central package meta data repository
Simple CLI
Commands
Invocation
Command redirection
Command completion
Explorer
The user interface
Section Tabs
Status Box
Log Button
WEKA Status Icon
Graphical output
Preprocessing
Loading Data
The Current Relation
Working With Attributes
Working With Filters
Classification
Selecting a Classifier
Test Options
The Class Attribute
Training a Classifier
The Classifier Output Text
The Result List
Clustering
Selecting a Clusterer
Cluster Modes
Ignoring Attributes
Working with Filters
Learning Clusters
Associating
Setting Up
Learning Associations
Selecting Attributes
Searching and Evaluating
Options
Performing Selection
Visualizing
The scatter plot matrix
Selecting an individual 2D scatter plot
Selecting Instances
Experimenter
Introduction
Standard Experiments
Simple
New experiment
Results destination
Experiment type
Datasets
Iteration control
Algorithms
Saving the setup
Running an Experiment
Advanced
Defining an Experiment
Running an Experiment
Changing the Experiment Parameters
Other Result Producers
Cluster Experiments
Remote Experiments
Preparation
Database Server Setup
Remote Engine Setup
Configuring the Experimenter
Multi-core support
Troubleshooting
Analysing Results
Setup
Saving the Results
Changing the Baseline Scheme
Statistical Significance
Summary Test
Ranking Test
KnowledgeFlow
Introduction
Features
Components
DataSources
DataSinks
Filters
Classifiers
Clusterers
Evaluation
Visualization
Examples
Cross-validated J48
Plotting multiple ROC curves
Processing data incrementally
Plugins
Flow components
Perspectives
ArffViewer
Menus
Editing
Bayesian Network Classifiers
Introduction
Local score based structure learning
Local score metrics
Search algorithms
Conditional independence test based structure learning
Global score metric based structure learning
Fixed structure 'learning'
Distribution learning
Running from the command line
Inspecting Bayesian networks
Bayes Network GUI
Bayesian nets in the experimenter
Adding your own Bayesian network learners
FAQ
Future development
III Data
ARFF
Overview
Examples
The ARFF Header Section
The ARFF Data Section
Sparse ARFF files
Instance weights in ARFF files
XRFF
File extensions
Comparison
ARFF
XRFF
Sparse format
Compression
Useful features
Class attribute specification
Attribute weights
Instance weights
Converters
Introduction
Usage
File converters
Database converters
Stemmers
Introduction
Snowball stemmers
Using stemmers
Commandline
StringToWordVector
Adding new stemmers
Databases
Configuration files
Setup
Missing Datatypes
Stored Procedures
Troubleshooting
Windows databases
IV Appendix
Research
Citing Weka
Paper references
Using the API
Option handling
Loading data
Loading data from files
Loading data from databases
Creating datasets in memory
Defining the format
Adding data
Randomizing data
Filtering
Batch filtering
Filtering on-the-fly
Classification
Building a classifier
Evaluating a classifier
Classifying instances
Clustering
Building a clusterer
Evaluating a clusterer
Clustering instances
Selecting attributes
Using the meta-classifier
Using the filter
Using the API directly
Saving data
Saving data to files
Saving data to databases
Visualization
ROC curves
Graphs
Tree
BayesNet
Serialization
Extending WEKA
Writing a new Classifier
Choosing the base class
Additional interfaces
Packages
Implementation
Methods
Guidelines
Writing a new Filter
Default approach
Implementation
Examples
Simple approach
SimpleBatchFilter
SimpleStreamFilter
Internals
Capabilities
Packages
Revisions
Testing
Option handling
GenericObjectEditor
Source code
Unit tests
Writing other algorithms
Clusterers
Attribute selection
Associators
Extending the Explorer
Adding tabs
Requirements
Examples
Adding visualization plugins
Introduction
Predictions
Errors
Graphs
Trees
Weka Packages
Where does Weka store packages and other configuration stuff?
Anatomy of a package
The description file
Additional configuration files
Contributing a package
Creating a mirror of the package meta data repository
Technical documentation
ANT
Basics
Weka and ANT
CLASSPATH
Setting the CLASSPATH
RunWeka.bat
java -jar
Subversion
General
Source code
JUnit
Specific version
Clients
GenericObjectEditor
Introduction
File Structure
Exclusion
Class Discovery
Multiple Class Hierarchies
Capabilities
Properties
Precedence
Examples
XML
Command Line
Serialization of Experiments
Serialization of Classifiers
Bayesian Networks
XRFF files
Other resources
Mailing list
Troubleshooting
Weka download problems
OutOfMemoryException
Windows
Mac OSX
StackOverflowError
just-in-time (JIT) compiler
CSV file conversion
ARFF file doesn't load
Spaces in labels of ARFF files
CLASSPATH problems
Instance ID
Adding the ID
Removing the ID
Visualization
Memory consumption and Garbage collector
GUIChooser starts but not Experimenter or Explorer
KnowledgeFlow toolbars are empty
Links
Bibliography
WEKA Manual for Version 3-7-5 Remco R. Bouckaert Eibe Frank Mark Hall Richard Kirkby Peter Reutemann Alex Seewald David Scuse October 28, 2011
c2002-2011 University of Waikato, Hamilton, New Zealand Alex Seewald (original Commnd-line primer) David Scuse (original Experimenter tutorial) This manual version 2. information about http://www.gnu.org/copyleft/gpl.html licensed under is More this the GNU General Public License found at can be license
Contents I The Command-line 1 A command-line primer 1.1 1.2 Basic concepts Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Dataset . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Classifier . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3 weka.filters . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.4 weka.classifiers . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Additional packages and the package manager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Package management 1.4.2 Running installed learning algorithms II The Graphical User Interface 2 Launching WEKA 3 Package Manager 3.1 Main window . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Installing and removing packages . . . . . . . . . . . . . . . . . . 3.3 Using a http proxy . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Using an alternative central package meta data repository . . . . 4 Simple CLI 4.1 Commands . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Invocation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Command redirection . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Command completion . . . . . . . . . . . . . . . . . . . . . . . . 5 Explorer 5.1 The user interface . . . . . . . . . . . . . . . . . . . . . . . . . . Section Tabs . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.1 5.1.2 Status Box . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.3 Log Button . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1.4 WEKA Status Icon . . . . . . . . . . . . . . . . . . . . . . 5.1.5 Graphical output . . . . . . . . . . . . . . . . . . . . . . . 5.2 Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 11 13 13 14 14 16 17 19 23 24 25 26 29 31 35 35 36 37 37 39 39 40 40 41 43 43 43 43 44 44 44 45
4 CONTENTS 5.2.1 Loading Data . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.2 The Current Relation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.3 Working With Attributes 5.2.4 Working With Filters . . . . . . . . . . . . . . . . . . . . 5.3 Classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Selecting a Classifier . . . . . . . . . . . . . . . . . . . . . 5.3.1 5.3.2 Test Options . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.3 The Class Attribute . . . . . . . . . . . . . . . . . . . . . 5.3.4 Training a Classifier . . . . . . . . . . . . . . . . . . . . . 5.3.5 The Classifier Output Text . . . . . . . . . . . . . . . . . 5.3.6 The Result List . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Selecting a Clusterer . . . . . . . . . . . . . . . . . . . . . 5.4.1 . . . . . . . . . . . . . . . . . . . . . . . . 5.4.2 Cluster Modes 5.4.3 Ignoring Attributes . . . . . . . . . . . . . . . . . . . . . . 5.4.4 Working with Filters . . . . . . . . . . . . . . . . . . . . . 5.4.5 Learning Clusters . . . . . . . . . . . . . . . . . . . . . . . 5.5 Associating . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5.1 Setting Up . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5.2 Learning Associations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6.1 Searching and Evaluating . . . . . . . . . . . . . . . . . . 5.6.2 Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6.3 Performing Selection . . . . . . . . . . . . . . . . . . . . . 5.7 Visualizing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7.1 The scatter plot matrix . . . . . . . . . . . . . . . . . . . Selecting an individual 2D scatter plot . . . . . . . . . . . 5.7.2 5.7.3 Selecting Instances . . . . . . . . . . . . . . . . . . . . . . 5.6 Selecting Attributes 6 Experimenter 6.2.1 Iteration control 6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Standard Experiments . . . . . . . . . . . . . . . . . . . . . . . . Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1.1 New experiment . . . . . . . . . . . . . . . . . . 6.2.1.2 Results destination . . . . . . . . . . . . . . . . 6.2.1.3 Experiment type . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1.4 Datasets 6.2.1.5 . . . . . . . . . . . . . . . . . . 6.2.1.6 Algorithms . . . . . . . . . . . . . . . . . . . . . 6.2.1.7 Saving the setup . . . . . . . . . . . . . . . . . . 6.2.1.8 Running an Experiment . . . . . . . . . . . . . . 6.2.2 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2.1 Defining an Experiment . . . . . . . . . . . . . . 6.2.2.2 Running an Experiment . . . . . . . . . . . . . . 6.2.2.3 Changing the Experiment Parameters . . . . . . 6.2.2.4 Other Result Producers . . . . . . . . . . . . . . 6.3 Cluster Experiments . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Remote Experiments . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Preparation . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.2 Database Server Setup . . . . . . . . . . . . . . . . . . . . 45 45 46 47 49 49 49 50 51 51 51 53 53 53 53 54 54 55 55 55 56 56 56 56 58 58 58 59 61 61 62 62 62 62 64 66 67 67 69 70 71 71 74 76 83 89 92 92 92
CONTENTS 5 93 6.4.3 Remote Engine Setup . . . . . . . . . . . . . . . . . . . . 94 6.4.4 Configuring the Experimenter . . . . . . . . . . . . . . . . 95 6.4.5 Multi-core support . . . . . . . . . . . . . . . . . . . . . . 95 6.4.6 Troubleshooting . . . . . . . . . . . . . . . . . . . . . . . 97 6.5 Analysing Results . . . . . . . . . . . . . . . . . . . . . . . . . . . Setup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 6.5.1 6.5.2 Saving the Results . . . . . . . . . . . . . . . . . . . . . . 100 6.5.3 Changing the Baseline Scheme . . . . . . . . . . . . . . . 100 6.5.4 Statistical Significance . . . . . . . . . . . . . . . . . . . . 101 6.5.5 . . . . . . . . . . . . . . . . . . . . . . . . 101 Summary Test 6.5.6 Ranking Test . . . . . . . . . . . . . . . . . . . . . . . . . 102 7 KnowledgeFlow 103 7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 7.2 Features . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 7.3 Components . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 7.3.1 DataSources . . . . . . . . . . . . . . . . . . . . . . . . . . 106 7.3.2 DataSinks . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 7.3.3 Filters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 7.3.4 Classifiers . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 7.3.5 Clusterers . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 7.3.6 Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . 106 7.3.7 Visualization . . . . . . . . . . . . . . . . . . . . . . . . . 108 7.4 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 7.4.1 Cross-validated J48 . . . . . . . . . . . . . . . . . . . . . 109 7.4.2 Plotting multiple ROC curves . . . . . . . . . . . . . . . . 111 7.4.3 Processing data incrementally . . . . . . . . . . . . . . . . 114 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 7.5.1 Flow components . . . . . . . . . . . . . . . . . . . . . . . 116 7.5.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . 116 7.5 Plugins 8 ArffViewer 119 8.1 Menus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 8.2 Editing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 9 Bayesian Network Classifiers Search algorithms 9.2.1 Local score metrics 9.2.2 125 9.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 9.2 Local score based structure learning . . . . . . . . . . . . . . . . 129 . . . . . . . . . . . . . . . . . . . . . 129 . . . . . . . . . . . . . . . . . . . . . . 130 9.3 Conditional independence test based structure learning . . . . . . 133 9.4 Global score metric based structure learning . . . . . . . . . . . . 135 9.5 Fixed structure ’learning’ . . . . . . . . . . . . . . . . . . . . . . 136 9.6 Distribution learning . . . . . . . . . . . . . . . . . . . . . . . . . 136 9.7 Running from the command line . . . . . . . . . . . . . . . . . . 138 Inspecting Bayesian networks . . . . . . . . . . . . . . . . . . . . 148 9.8 9.9 Bayes Network GUI . . . . . . . . . . . . . . . . . . . . . . . . . 151 9.10 Bayesian nets in the experimenter . . . . . . . . . . . . . . . . . 163 9.11 Adding your own Bayesian network learners . . . . . . . . . . . . 163 9.12 FAQ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
6 CONTENTS 9.13 Future development . . . . . . . . . . . . . . . . . . . . . . . . . 166 III Data 169 10 ARFF 171 10.1 Overview . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 10.2 Examples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 10.2.1 The ARFF Header Section . . . . . . . . . . . . . . . . . 172 10.2.2 The ARFF Data Section . . . . . . . . . . . . . . . . . . . 174 . . . . . . . . . . . . . . . . . . . . . . . . . . 175 . . . . . . . . . . . . . . . . . . . 176 10.3 Sparse ARFF files 10.4 Instance weights in ARFF files 11 XRFF 177 11.1 File extensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 11.2 Comparison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 11.2.1 ARFF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 11.2.2 XRFF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 11.3 Sparse format . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 11.4 Compression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 11.5 Useful features . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 11.5.1 Class attribute specification . . . . . . . . . . . . . . . . . 180 11.5.2 Attribute weights . . . . . . . . . . . . . . . . . . . . . . . 180 11.5.3 Instance weights . . . . . . . . . . . . . . . . . . . . . . . 181 12 Converters 183 12.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 12.2 Usage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184 12.2.1 File converters . . . . . . . . . . . . . . . . . . . . . . . . 184 12.2.2 Database converters . . . . . . . . . . . . . . . . . . . . . 184 13 Stemmers 187 13.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 13.2 Snowball stemmers . . . . . . . . . . . . . . . . . . . . . . . . . . 187 13.3 Using stemmers . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 13.3.1 Commandline . . . . . . . . . . . . . . . . . . . . . . . . . 188 13.3.2 StringToWordVector . . . . . . . . . . . . . . . . . . . . . 188 13.4 Adding new stemmers . . . . . . . . . . . . . . . . . . . . . . . . 188 14 Databases 189 14.1 Configuration files . . . . . . . . . . . . . . . . . . . . . . . . . . 189 14.2 Setup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 14.3 Missing Datatypes . . . . . . . . . . . . . . . . . . . . . . . . . . 191 14.4 Stored Procedures . . . . . . . . . . . . . . . . . . . . . . . . . . 192 14.5 Troubleshooting . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 15 Windows databases 195
CONTENTS IV Appendix 7 199 16 Research 201 16.1 Citing Weka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 16.2 Paper references . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 17 Using the API 205 17.1 Option handling . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 17.2 Loading data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 17.2.1 Loading data from files . . . . . . . . . . . . . . . . . . . 208 17.2.2 Loading data from databases . . . . . . . . . . . . . . . . 209 17.3 Creating datasets in memory . . . . . . . . . . . . . . . . . . . . 212 17.3.1 Defining the format . . . . . . . . . . . . . . . . . . . . . 212 17.3.2 Adding data . . . . . . . . . . . . . . . . . . . . . . . . . 213 17.4 Randomizing data . . . . . . . . . . . . . . . . . . . . . . . . . . 215 17.5 Filtering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 17.5.1 Batch filtering . . . . . . . . . . . . . . . . . . . . . . . . 217 17.5.2 Filtering on-the-fly . . . . . . . . . . . . . . . . . . . . . . 218 17.6 Classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 . . . . . . . . . . . . . . . . . . . . . 219 17.6.1 Building a classifier 17.6.2 Evaluating a classifier . . . . . . . . . . . . . . . . . . . . 221 17.6.3 Classifying instances . . . . . . . . . . . . . . . . . . . . . 224 17.7 Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 17.7.1 Building a clusterer . . . . . . . . . . . . . . . . . . . . . 226 17.7.2 Evaluating a clusterer . . . . . . . . . . . . . . . . . . . . 228 17.7.3 Clustering instances . . . . . . . . . . . . . . . . . . . . . 230 17.8 Selecting attributes . . . . . . . . . . . . . . . . . . . . . . . . . . 231 17.8.1 Using the meta-classifier . . . . . . . . . . . . . . . . . . . 232 17.8.2 Using the filter . . . . . . . . . . . . . . . . . . . . . . . . 233 17.8.3 Using the API directly . . . . . . . . . . . . . . . . . . . . 234 17.9 Saving data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 17.9.1 Saving data to files . . . . . . . . . . . . . . . . . . . . . . 235 17.9.2 Saving data to databases . . . . . . . . . . . . . . . . . . 235 17.10Visualization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 17.10.1 ROC curves . . . . . . . . . . . . . . . . . . . . . . . . . . 237 17.10.2 Graphs . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 17.10.2.1 Tree . . . . . . . . . . . . . . . . . . . . . . . . . 238 17.10.2.2 BayesNet . . . . . . . . . . . . . . . . . . . . . . 239 17.11Serialization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240 18 Extending WEKA 243 18.1 Writing a new Classifier . . . . . . . . . . . . . . . . . . . . . . . 244 18.1.1 Choosing the base class . . . . . . . . . . . . . . . . . . . 244 18.1.2 Additional interfaces . . . . . . . . . . . . . . . . . . . . . 245 18.1.3 Packages . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 18.1.4 Implementation . . . . . . . . . . . . . . . . . . . . . . . . 246 . . . . . . . . . . . . . . . . . . . . . . 246 . . . . . . . . . . . . . . . . . . . . . 250 18.2 Writing a new Filter . . . . . . . . . . . . . . . . . . . . . . . . . 256 18.2.1 Default approach . . . . . . . . . . . . . . . . . . . . . . . 256 18.1.4.1 Methods 18.1.4.2 Guidelines
8 CONTENTS 18.2.1.1 Implementation . . . . . . . . . . . . . . . . . . 256 18.2.1.2 Examples . . . . . . . . . . . . . . . . . . . . . . 259 18.2.2 Simple approach . . . . . . . . . . . . . . . . . . . . . . . 263 18.2.2.1 SimpleBatchFilter . . . . . . . . . . . . . . . . . 263 18.2.2.2 SimpleStreamFilter . . . . . . . . . . . . . . . . 265 . . . . . . . . . . . . . . . . . . . . . . 267 18.2.2.3 Internals 18.2.3 Capabilities . . . . . . . . . . . . . . . . . . . . . . . . . . 267 18.2.4 Packages . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 18.2.5 Revisions . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 18.2.6 Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 18.2.6.1 Option handling . . . . . . . . . . . . . . . . . . 268 18.2.6.2 GenericObjectEditor . . . . . . . . . . . . . . . . 268 18.2.6.3 Source code . . . . . . . . . . . . . . . . . . . . . 268 18.2.6.4 Unit tests . . . . . . . . . . . . . . . . . . . . . . 268 18.3 Writing other algorithms . . . . . . . . . . . . . . . . . . . . . . . 269 18.3.1 Clusterers . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 18.3.2 Attribute selection . . . . . . . . . . . . . . . . . . . . . . 271 18.3.3 Associators . . . . . . . . . . . . . . . . . . . . . . . . . . 273 . . . . . . . . . . . . . . . . . . . . . . . 275 18.4.1 Adding tabs . . . . . . . . . . . . . . . . . . . . . . . . . . 275 18.4.1.1 Requirements . . . . . . . . . . . . . . . . . . . . 275 18.4.1.2 Examples . . . . . . . . . . . . . . . . . . . . . . 275 . . . . . . . . . . . . . . . . 283 18.4.2.1 Introduction . . . . . . . . . . . . . . . . . . . . 283 18.4.2.2 Predictions . . . . . . . . . . . . . . . . . . . . . 283 18.4.2.3 Errors . . . . . . . . . . . . . . . . . . . . . . . . 286 18.4.2.4 Graphs . . . . . . . . . . . . . . . . . . . . . . . 288 18.4.2.5 Trees . . . . . . . . . . . . . . . . . . . . . . . . 289 18.4.2 Adding visualization plugins 18.4 Extending the Explorer 19 Weka Packages 291 19.1 Where does Weka store packages and other configuration stuff? . 291 19.2 Anatomy of a package . . . . . . . . . . . . . . . . . . . . . . . . 292 19.2.1 The description file . . . . . . . . . . . . . . . . . . . . . . 292 19.2.2 Additional configuration files . . . . . . . . . . . . . . . . 296 19.3 Contributing a package . . . . . . . . . . . . . . . . . . . . . . . . 297 19.4 Creating a mirror of the package meta data repository . . . . . . 297 20 Technical documentation 301 20.1 ANT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 20.1.1 Basics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 20.1.2 Weka and ANT . . . . . . . . . . . . . . . . . . . . . . . . 301 20.2 CLASSPATH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302 20.2.1 Setting the CLASSPATH . . . . . . . . . . . . . . . . . . 302 20.2.2 RunWeka.bat . . . . . . . . . . . . . . . . . . . . . . . . . 303 20.2.3 java -jar . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 20.3 Subversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 20.3.1 General . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304 20.3.2 Source code . . . . . . . . . . . . . . . . . . . . . . . . . . 304 20.3.3 JUnit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 20.3.4 Specific version . . . . . . . . . . . . . . . . . . . . . . . . 305
分享到:
收藏